Lightblue、商用利用可能な日本語LLM「Karasu」「Qarasu」を公開

既存の日本語公開モデルの中で最高性能を達成、オンプレミス環境でのLLM利用を実現可能に

株式会社Lightblue

生成AIの研究開発「LLab」を運営し、日本語LLMの開発・提供を手掛ける株式会社Lightblue(代表取締役:園田亜斗夢、本社:東京都千代田区、以下「Lightblue」)は商用利用可能な日本語LLM「Karasu」「Qarasu」を公開したことをお知らせします。

■ Karasu/Qarasuシリーズについて

Karasuシリーズは70億パラメータのShisa( https://huggingface.co/augmxnt/shisa-7b-v1 )に対して、日本語と英語の学習データを用いて70億トークンで継続事前学習とファインチューニングを実施したモデルです。

またQarasuシリーズは、140億パラメータのQwen-14B( https://huggingface.co/Qwen/Qwen-14B )に対して、Karasuシリーズで培ったノウハウを活かしファインチューニングしたモデルです。モデルの開発においてはGoogleの「Google for Startups クラウドプログラム」とアマゾン ウェブ サービス ジャパン(AWSジャパン)の「AWS LLM 開発支援プログラム」を活用しました。


Karasuシリーズは70億パラメータのモデルとして、非常に軽量であり、一部の13Bのモデルと同等の性能を示します。

Qarasuシリーズは140億パラメータのモデルであり、既存の日本語公開モデルの中で最高性能を達成しgpt-3.5に迫る性能を示します

日本語言語モデルの性能を評価するためのベンチマークの一つである MT-Benchの6タスク平均スコアはKarasu6.70Qarasu7.60となっています(表1)。

モデル名の由来は、日本神話に登場するカラスであり、導きの神の「八咫烏(ヤタガラス)」からきています。


公開した各種モデルの詳細は、note記事に記載しております。

・「データサイエンティストによるnote記事(英語版)」

 https://note.com/peter_lightblue/n/ne08a7c8cc47a

・「日本語に翻訳したnote記事」

   https://note.com/peter_lightblue/n/n2def04ca0d30


公開した「Karasu/Qarasu」シリーズのモデル一覧

   https://huggingface.co/collections/lightblue/karasu-658e78e9188f3934c6fb701e


また、Qarasuについてはチャット形式のデモについても公開しています。

 https://lightblue-qarasu.serveo.net

※アクセス過多によりリクエストが処理されるまで待ち時間が発生することがあります。


■ Karasu/Qarasuシリーズの性能

図1:日本語言語モデルベンチマークMT-Benchでの評価結果

表1:日本語言語モデルベンチマークMT-Benchのスコア一覧

KarasuシリーズのライセンスはApache2.0であり、商用利用可能です。

QarasuシリーズのライセンスはQwenのTongyi Qianwen LICENSE AGREEMENTを継承しており、利用条件によっては商用利用することが可能です。詳細はライセンスの公式情報(https://github.com/QwenLM/Qwen/blob/main/Tongyi%20Qianwen%20LICENSE%20AGREEMENT)をご確認ください。


■ LLabについて

Lightblueの生成AI特化開発チーム「LLab」では、生成AI活用を目指す現場において真に実用的なLLM実装をサポートします。 「LLab」では、オンプレミスで個社に合わせた独自モデルを提供することはもちろん、DXコンサルティングおよび受託開発で培ったノウハウをフル活用し、各社・各部署・現場ごとの業務理解を基盤としたカスタマイズを実施します。 

【独自開発が有効な現場】 

 1. 専門性が高い現場: 

  建設、製薬など、業界・法人ごとの専門用語が多い

  2. 情報セキュリティレベルが高い現場: 

  金融、医療など、高レベルのデータ侵害対策が必要 

 3. インターネットにアクセスしづらい現場:

   工場や建設現場など、通信環境の整備が難しい


「LLab」および本モデルを用いた企業内でのAI活用推進に興味のある方は、以下のリンクからお問い合わせください。

 http://lightblue-tech.hubspotpagebuilder.com/lightblue-llab



株式会社Lightblueについて

Lightblueは、AIの民主化を目指し、画像解析・自然言語処理AIを軸にソリューションを開発している東大発スタートアップ企業です。生成AI・LLMの研究開発に特化したチーム「LLab」を設立し、安全性と透明性を重視したAIモデルの開発に取り組んでいます。AI技術の活用範囲を広げ、社会にポジティブな変革をもたらすことを目指しています。


社名:株式会社Lightblue
設立:2018年1月
代表者:代表取締役 園田 亜斗夢
所在地:東京都千代田区神田小川町3-28-5 axle御茶ノ水 PB02
AI顧問:鳥海不二夫(東京大学工学系研究科教授)

事業内容: 画像解析・自然言語処理AIを軸にソリューションを開発。

 ・人物にフォーカスした画像解析システム「Human Sensing」

・SlackやTeamsにて利用できる法人向けChatGPT「Lightblue Assistant」


●Lightblueコーポレートサイト https://www.lightblue-tech.com/

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

株式会社Lightblue

37フォロワー

RSS
URL
https://www.lightblue-tech.com/
業種
情報通信
本社所在地
東京都千代田区神田駿河台2丁目3-6 CIRCLESお茶の水5F
電話番号
-
代表者名
園田亜斗夢
上場
未上場
資本金
1億5800万円
設立
2018年01月