2026/01/14 シェア 自律稼働デバイス向けの軽量な大規模視覚言語モデルを開発 Preferred Networks は、自律稼働デバイス向けに軽量な大規模視覚言語モデル (VLM)「PLaMo 2.1-8B-VL」を開発した。言語情報と視覚情報を高度に統合して処理できるため、高度な画像理解が可能だ。 [続きを読む] 提供元 : MONOist