AIワンダーランド

AIエンジニアの個人開発ブログ

日本語特化型大規模言語モデル(LLM)の公開予定紹介

更新日:2023年5月17日

概要

今やAIの中心話題となっている生成AI

特にChatGPT公開により一躍有名となった

大規模言語モデル(LLM)ですが

 

いよいよオープンソース公開が増えてきましたね!!

 

各社がどのように展開し、評価されていくのか

どこが中心的な存在になるのか、、ここからの変遷が楽しみです。

 

そうした中で日本語特化モデル公開を予定している有名どころは今のところ3つですかね。

 

公開予定の日本語特化型言語モデル

1.サイバーエージェント

www.cyberagent.co.jp

 

サイバーエージェントさんの11日のプレスでは日時が名言されていないのですが

本日の日経に記事が載っていて

明日17日に公開!?

とのことです。

 

「日本語特化言語モデル」としてはサイバーさんが一番のりですね~~!

 

www.nikkei.com

 

================================

5/17追記:さっそく動かしてみました。

ai-wonderland.com

================================

 

2.Stability AI 

4/20に「StableLM」、4月28日には世界初のオープンソースRLHF LLMチャットボット「StableVicuna」をリリース済ですが、日本語特化モデルも開発中

 

先週行ってきた「AI EXPO2023」では、発表があるかと思っていたのですが特にまだスケジュールが明かされていないのが、Stability AI さんの日本語特化LLM

開発中とのことなので、こちらも期待大ですね~

Stable Diffusionの時のような衝撃とともに話題を席巻するのでしょうか。

 

ja.stability.ai

 

3.ソフトバンク・LINEの和製GPT

5月10 日の決算会見で発表がありましたが

GPTの基礎技術を応用して和製GPTを立ち上げようと準備しているとのこと。

LINE AiCallやHyperCLOVAで大規模言語モデルの実績があり、AI人材も豊富なソフトバンクさんなので期待値も上がりますね。

 

japan.cnet.com

 

 

ここから各チャットボット関連会社さんも一斉にオープンソース利用に動きだすのか気になるところです。

 

早くチャットボットに組み込んで試してみたいです。

 

参考

フリーで使える日本語の主な大規模言語モデル(LLM)をまとめて紹介されている記事がありましたのでご紹介。

企業または研究機関が公表しているモデルのみ掲載とのこと。

GPT2の日本語モデルあったんですね!知らなかったです。

 

zenn.dev

 

以上、日本語特化型大規模言語モデル(LLM)の公開予定紹介 でした。

ではまた。