【迅速発送】Vision Transformer入門 (Computer Vision Library)

【迅速発送】Vision Transformer入門 (Computer Vision Library) 收藏

当前价格: 7370 日元(合 336.81 人民币)

一口价: 7370 (合 336.81 人民币)

剩余时间:16434.5683142

商品原始页面

成为包月会员,竞拍更便捷

出价竞拍

一口价

预约出价

收藏商品

收藏卖家

费用估算

拍卖号:q1226291572

开始时间:04/21/2026 23:06:28

个 数:1

结束时间:04/24/2026 23:06:28

商品成色:新品

可否退货:可

提前结束:可

日本邮费:卖家承担

自动延长:不可

最高出价:

出价次数:0

卖家账号:mmw******** 收藏卖家

店铺卖家:不是

发货地:千葉県

店家评价:好评:346 差评:9 拉黑卖家

卖家其他商品: 查看

  • 1、【自动延长】:如果在结束前5分钟内有人出价,为了让其他竞拍者有时间思考,结束时间可延长5分钟。
  • 2、【提前结束】:卖家觉得达到了心理价位,即使未到结束时间,也可以提前结束。
  • 3、参考翻译由网络自动提供,仅供参考,不保证翻译内容的正确性。如有不明,请咨询客服。
  • 4、本站为日拍、代拍平台,商品的品质和卖家的信誉需要您自己判断。请谨慎出价,竞价成功后订单将不能取消。
  • 5、违反中国法律、无法邮寄的商品(注:象牙是违禁品,受《濒临绝种野生动植物国际贸易公约》保护),本站不予代购。
  • 6、邮政国际包裹禁运的危险品,邮政渠道不能发送到日本境外(详情请点击), 如需发送到日本境外请自行联系渠道。
ご覧いただきありがとうございます。即購入OKです。

新しいコンピュータビジョンの世界

自然言語処理分野におけるブレイクスルーとなったTransformerをコンピュータビジョンに応用したモデルがVision Transformer(ViT)です。さまざまなコンピュータビジョンのタスクにおいて、ディープラーニングではスタンダードとなっているRNN、CNN、および既存手法を用いた処理精度を上回ることが確認されています。

本書は注目のViTの入門書です。Transformerの成り立ちからはじめ、その理論と実装を解説していきます。今後のViTの活用が期待される応用タスク、ViTから派生したモデルを紹介したあと、TransoformerとViTを分析し、その謎を解明していきます。今後も普及が期待されるViTを盛りだくさんでお届けします。

(こんな方におすすめ)
・ViTに興味のある方
・実務で画像処理に取り組んでいる方

(目次)
第1章 TransformerからVision Transformerへの進化
  1-1 自然言語処理におけるTransformerの登場
  1-2 Vision and Languageへの拡張
  1-3 コンピュータビジョンにおけるTransformer

第2章 Vision Transformerの基礎と実装
  2-1 準備
  2-2 ViTの全体像
  2-3 Input Layer
  2-4 Self-Attention
  2-5 Encoder
  2-6 ViTの実装

第3章 実験と可視化によるVision Transformerの探求
  3-1 実験の概要
  3-2 使用するデータセット
  3-3 実験条件
  3-4 既存手法との比較
  3-5 データ拡張における比較
  3-6 位置埋め込みの可視化
  3-7 ViTにおける判断根拠の可視化
  3-8 ViTが捉えているモノ

第4章 コンピュータビジョンタスクへの応用
  4-1 コンピュータビジョンのサブタスク
  4-2 画像認識への応用
  4-3 物体検出、セマンティックセグメンテーションへの応用
  4-4 動画認識への応用
  4-5 オブジェクトトラッキングへの応用
  4-6 3Dビジョンへの応用
  4-7 その他のコンピュータビジョンサブタスクへの応用
  4-8 Transformer応用のまとめと展望

第5章 Vision and Languageタスクへの応用
  5-1 Vision and Languageのサブタスク
  5-2 VQAへの応用
  5-3 Image Captioningへの応用
  5-4 Embodied AIへの応用
  5-5 その他のVision and Languageサブタスクへの応用
  5-6 Vision and Languageのまとめと展望

第6章 Vision Transformerの派生手法
  6-1 ViT派生手法の分類
  6-2 Swin Transformer
  6-3 DeiT
  6-4 CvT
  6-5 SegFormer
  6-6 TimeSformer
  6-7 MAE

第7章 Transformerの謎を読み解く
  7-1 Transformerの謎に人々は驚き困惑した
  7-2 Positional Embeddingの謎
  7-3 Multi-Head Attentionの謎
  7-4 Layer Normalizationの謎

第8章 Vision Transformerの謎を読み解く
  8-1 ViT vs CNN vs MLPの三国時代の到来
  8-2 ViTはCNNと同じく局所特徴を学習する
  8-3 ViTはより形状に反応する?
  8-4 ViTは早期から大域的な領域も見ている
  8-5 ViTはCNNやMLPよりもノイズや敵対的攻撃に頑健?
  8-6 3つのモデルの特性と使い分けの勘どころ
  8-7 ViTの新常識

続きを読む
SKU-202604130006-097170ac
出价者 信用 价格 时间

推荐