実世界の大規模動画データでVLMを進化させるAI研究者募集!
膨大な動画データと最先端のVision-Language Model(VLM)技術を活用し、「人の行動を文脈ごと理解する」新たな知能の開発に挑んでいます。現実世界に根ざしたAI研究に興味がある方、大規模データで実践的なモデル開発に携わりたい方、実装力と好奇心を武器に、私たちと共に”行動を理解するAI”の未来を創りませんか?
このポジションの魅力
• 実社会の大規模動画データを用いた、Vision-Language Model(VLM)の開発に直接携われます
• マルチGPU