博報堂テクノロジーズ、日本語特化の視覚と言語を組み合わせた事前学習モデルを開発―画像検索において、英語モデルを上回る検索精度を実現―
博報堂テクノロジーズ、日本語特化の視覚と言語を組み合わせた事前学習モデルを開発株式会社博報堂テクノロジーズ(東京都港区、代表者:米谷修)は、日本語に特化した画像とテキストの理解を深めるための視覚言語事前学習モデルを開発し、このたびHugging Face上で無償公開(ただし非商用に限る)したことをお知らせします。このモデルは、画像検索、テキストからの画像生成、画像のタグ付け、画像に対する質問応答など、多岐にわたる応用が可能です。【研究・開発の背景と貢献】多くの視覚言語事前学習(Vision-Language Pre-training; VLP)技術は、英語中心の開発により、日本語データへ...
メンバーと話せる