▼ ニュースのポイント
①サイバーエージェントが最大68億パラメータの日本語大規模言語モデルを一般公開した。
②国内の公開モデルとしては最大級。
③同モデルは商用利用が可能。
国内最大級の公開モデル
サイバーエージェントは5月17日、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開した。
近年、生成AI・LLMの開発が急速に進化しているが、そのほとんどは英語中心に学習され、日本語や日本文化に精通したLLMは少ないのが現状だ。
こうした中、同社は自然な日本語の文章生成を実現しようと、独自の日本語LLMの開発に取り組んでいる。
今回は、日本国内の公開モデルとしては最大級の規模となるモデル「OpenCALM-7B」をHugging Face Hubにて公開した。
同モデルは、WikipediaやCommon Crawlの日本語データで学習したもので、商用利用が可能(ライセンスはCC BY-SA 4.0)。同モデルをベースにチューニングすることで、対話型AIの開発なども可能となり、より多くの人が日本語ベースの自然言語処理に関する最先端の研究を行うことができるようになる。
LLMを活用したビジネス開発を予定
同社では、これまで培った知見を活かし、業界に特化したLLMの構築や、企業連携LLMを活用したビジネスの開発を予定している。このため、エンジニアを新規採用し、体制を強化する考えだ。
(画像はプレスリリースより)
サイバーエージェント プレスリリース
https://www.cyberagent.co.jp/news/detail/id=28817▼ 会社概要
サイバーエージェントは、メディア事業、インターネット広告事業、ゲーム事業などを行う企業。
社名:株式会社サイバーエージェント
代表取締役:藤田 晋
所在地:東京都渋谷区宇田川町40番1号 Abema Towers