新規
会員登録

ECzineニュース

博報堂テクノロジーズ、日本語特化型の視覚言語事前学習モデルを開発　画像・テキストの関連度提案力向上へ

ECzine編集部[著]

2024/03/15 08:00

通知

　博報堂テクノロジーズは、日本語に特化した画像とテキストの理解を深めるための視覚言語事前学習モデルを開発。非商用利用に限りHugging Face上で無償公開した旨を発表した。同モデルは、画像検索、テキストからの画像生成、画像のタグ付け、画像に対する質問応答など、多岐にわたる応用が可能となっている。

研究・開発の背景と貢献

　多くの視覚言語事前学習（Vision-Language Pre-training; VLP）技術は、英語中心の開発により、日本語データへの対応が不十分だった。博報堂テクノロジーズは、画像エンコーダの改良と訓練データ量の増加、言語エンコーダの能力強化を通じ、日本語特化VLPモデルを開発。同モデルにより、たとえば「桜の花が満開の公園」などの具体的なシーンを日本語で検索した際、関連度の高い画像を正確に見つけ出すことが可能となる。

　今回のモデル公開により、博報堂テクノロジーズは、研究コミュニティやAI技術の開発者に対し、より高度な日本語の視覚言語理解の基盤を提供。今後も継続的な技術革新を通じて、研究コミュニティへの貢献を強化していく予定だという。

この記事は参考になりましたか？

関連リンク: プレスリリース

この記事の著者: ECzine編集部（イーシージンヘンシュウブ）

ECZine編集部です。ネットショップ運営に役立つ情報をお届けします。

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

この著者の最近の執筆記事

この記事をシェア

通知

Special Contents

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

ECzine Day（イーシージン・デイ）とは、ECzineが主催するカンファレンス型のイベントです。変化の激しいEC業界、この日にリアルな場にお越しいただくことで、トレンドやトピックスを効率的に短時間で網羅する機会としていただければ幸いです。

イベントカレンダーを見る

新規会員登録無料のご案内

・全ての過去記事が閲覧できます
・会員限定メルマガを受信できます

メールバックナンバー

新規会員登録無料

アクセスランキング

アクセスランキング