機械学習で自動分類する文書管理ソフト crossnote ML による分類例を公開

果たして、明治の文豪の文章に現れる個性を機械は判別できるのか?

アップデイティット株式会社

総合文書管理ソフト「crossnote」のオプション機能である、機械学習による文書の自動分類を誰にでも手軽に実現できるcrossnote MLを使って、実際にドキュメントを分類した例を公開しました。
ITベンチャーのアップデイティット株式会社(update it, Inc.)は次世代型統合文書管理ソフトcrossnoteの新オプション機能 crossnote MLを用いた、機械学習による文書の自動分類例を公開いたしました。crossnote MLは機械学習の仕組みを応用し、分けたい例(教師データ)をある程度与えるとその傾向を学習・分析し、crossnoteに保存されたドキュメントを自動的に分類する仕組みで、専門的な知識を必要とせず機械学習を利用することができます。

機械学習による自動分類がどの程度実用性があるのかを知って頂くための試みとして、以下の3つのテーマについて自動分類を行い、評価結果を公表いたしました。

crossnoteの機械学習で文章から作者を判別する
明治の文豪たちの作品をMLに学習させ、文体だけで作者別に分類できるか試してみました。
文章に現れる個性を機械は判別できるのでしょうか?
 


crossnoteの機械学習でパブリックコメントを分類する
神奈川県で募集した高校入試制度についてのパブリックコメントをMLを用いて分類してみました。
パブリックコメントは自由記載のため、同じ内容でも人によって書き方が違います。また1項目当たりのデータ数が少ないうえ、似た内容を分類するため、難易度の高い課題です。
 

 

crossnoteの機械学習でWikipediaの記事を分類する
Wikipediaにある哺乳類の項目から「分布」、「生体」、「形態」について記述されている箇所を抜き出して、正しく分類できるかを試してみました。
 

 

crossnoteは現在、製薬業界における新薬申請業務や自動車のマニュアル作成など、ドキュメンテーションが重要な業務となる分野でお使い頂いております。提供形態はオンプレミス型、クラウド型のいずれでの提供も可能で、crossnote MLはcrossnoteへのアドオン(サイトライセンス)として提供されます。

なおcrossnote MLは弊社技術顧問の、ニューヨーク大学准教授 関根聡氏との共同研究を元に開発しております。

■ crossnoteによる実際の分類例については、以下のページをご参照ください。
http://www.updateit.co.jp/ml.html#example

■ crossnoteについての詳細は当社ホームページをご参照ください。
http://www.updateit.co.jp/

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。


会社概要

アップデイティット株式会社

0フォロワー

RSS
URL
http://www.updateit.co.jp
業種
情報通信
本社所在地
神奈川県横浜市都筑区中川1丁目6-35 中川カスケード201
電話番号
045-910-5825
代表者名
安中伸彦
上場
未上場
資本金
4000万円
設立
2006年09月