コールセンターのVoC分析を支援する個人情報マスキングAIを公開
10億パラメータのGPTモデルをコールログに特化したデータセットで学習させることにより高精度マスキングを実現
株式会社キャメルテクノロジー(本社:東京都新宿区、代表取締役:松岡 遼馬)は、コールセンターの通話ログなどのテキストデータから個人情報を高精度で自動マスキングするための生成AIモデル「japanese-gpt-1b-PII-masking」を開発し公開しました。
■サマリー
-
コールセンターの通話ログを対象とした、個人情報の自動マスキングに特化した生成AIモデルを公開
-
氏名、住所、組織名などの電話問い合わせの中でよく現れる個人情報を高精度で検知し、マスキング
-
10億パラメータの大規模言語モデル(LLM)をベースに、5000件の通話ログでファインチューニングを実施
-
性能評価では再現率(Recall)と精度(Precision)がいずれも95%という高い水準を達成
-
オンプレミス環境での導入が可能で、高いセキュリティ基準にも対応。また、クラウド環境でも利用可能で、柔軟な導入が可能
■モデルおよびデモサイト
モデル
本ツールはHuggingFaceにて公開しております。
https://huggingface.co/cameltech/japanese-gpt-1b-PII-masking
デモサイト
以下のリンクからデモを触っていただくことができます。個人情報マスキングの性能や速度をぜひ体験してみてください。
https://huggingface.co/spaces/cameltech/japanese-gpt-1b-PII-masking-demo
VoC分析に特化した個人情報マスキングツール
近年、様々な企業がコールセンターに蓄積された顧客との通話ログを分析(VoC分析)し、サービス改善に活用する取り組みを進めています。一方で、通話ログには氏名、住所、連絡先など多くの個人情報が含まれるため、分析の際にはこれらの情報を適切にマスキングする必要があります。弊社では、この個人情報マスキングの作業を効率化・自動化するためのAI技術の開発に取り組んでまいりました。
この度公開する個人情報マスキングツールは、コールセンターの通話ログなどの大規模なテキストデータを対象に、氏名、住所、組織名など電話問い合わせの中でよく現れる個人情報を高い精度で自動検知し、マスキングすることに特化しています。本ツールを活用することで、VoC分析の際の個人情報マスキング作業を大幅に効率化できます。
10億パラメータのGPTモデルにより高精度抽出を実現
本ツールは、10億のパラメータを持つ大規模言語モデル(rinna/japanese-gpt2)をベースとし、5000件のコールセンターの通話ログデータを用いてファインチューニングしています。これにより、コールセンター特有の言い回しや表現パターンも踏まえた高精度の個人情報抽出を実現しています。
弊社では本ツールの性能を評価するために、コールセンターの通話ログを再現した大規模なテストデータを構築し、性能評価を実施したところ、個人情報の検知における再現率(Recall)と精度(Precision)がいずれも95%という高い水準を達成することを確認しました。
手元のPCでも動作するため、高セキュリティ環境でも導入が簡単
また、本ツールは手元のPC上での動作も可能で、オンプレミス環境でも導入できるため、セキュリティ基準の高い企業でも安心して利用いただけます。クラウド環境(国内サーバー)での利用にも対応しており、柔軟な導入が可能です。
今後の展望
企業の生成AI活用における個人情報の適切な取り扱いは喫緊の課題であり、具体的な対策への期待が高まっています。弊社では今後も企業のVoC活用を支援するためのAIソリューションの開発を進めるとともに、個人情報のセキュアな取り扱いと生成AI活用の両立を支援することで、企業のDXを力強く後押ししてまいります。
■本件に関するお問い合わせ先
株式会社キャメルテクノロジー
R&D事業部
担当: 鈴木、西田
TEL: 03-6770-0477
E-mail:info@cameltech.jp
■株式会社キャメルテクノロジー概要
デジタル技術や生成AIを活用したソリューションを提供。戦略立案から実装まで、企業・自治体のDXをトータルでコーディネートしています。複数の大手企業と、AI活用の大型プロジェクトを進行中。
<会社概要>
社名 :株式会社キャメルテクノロジー
所在地:東京都新宿区西新宿3-3-13 西新宿水間ビル6F
代表者:松岡遼馬
このプレスリリースには、メディア関係者向けの情報があります
メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。
すべての画像