DSOC、ジョンズホプキンス大学のAngelo Mele准教授と共同研究したネットワーク解析のアルゴリズムをオープンソースで公開

ネットワークの生成メカニズムを解析する、スケーラブルで高速なアルゴリズムを提案

Sansan株式会社

Sansan株式会社は、同社のデータ統括組織DSOCが、共同研究プラットフォーム「Sansan Data Discovery」のプロジェクトにおいて、ジョンズホプキンス大学のAngelo Mele准教授と共同開発したネットワークの生成メカニズムを解析する、スケーラブルで高速なアルゴリズムをオープンソースとして公開しました。

今回公開したアルゴリズムは、単純な実装と比べて、約14,000倍の高速化を実現しています。また、このアルゴリズムをSansan株式会社が提供する名刺アプリ「Eight」のデータに応用し、名刺交換ネットワークのメカニズムを分析した研究結果は、ワーキングペーパーとして論文アーカイブサイト「arXiv(アーカイヴ)」にて公開しています。

研究背景
DSOCでは、共同研究を行うプラットフォーム「Sansan Data Discovery」において、名刺交換という出会いのデータベースから新たな価値を導き出すべく、各分野におけるトップレベルの外部識者と分野の垣根を越えて研究に取り組んでいます。

その中で、経済学のネットワーク分野における第一人者であるジョンズホプキンス大学のAngelo Mele准教授とDSOC研究開発部 SocSci Groupに在籍するJuan Martínez、小松 尚太、西田 貴紀は、ビジネスの出会いのメカニズムを解明するプロジェクトに取り組んでまいりました。

近年、ネットワークを扱う経済学では、経済ショックの波及効果や新技術の伝播など社会課題を解決するテーマの研究が盛んに行われています。しかし、既存のネットワークの生成メカニズムを経済学的に明らかにするアルゴリズムは、計算コストが非常にかかるという課題があり、実証研究においてビッグデータが扱われるようになってからボトルネックになっていました。

このような課題からAngelo Mele准教授と高速でスケーラブルなアルゴリズムの共同研究に積極的に取り組み、当社の事業貢献のみならず、行政機関に対して研究結果を政策の評価・検証などに重要な関連を持つ情報やデータ(エビデンス)として提供し、行政機関による政策立案やその実施を後押しするEBPMの取り組みを支援することを見据えていました。

また、アルゴリズムのコードをオープンソースで公開することで、ネットワーク分野の研究がさらに発展することを目標としています。今回、OSS(Open-Source Software)の考えに基づいて、DSOCが開発を行っているプロジェクトEcon Sourceの一環として、「lighthergm」というライブラリを公開致しました。

研究の概要
本研究では「ビジネスネットワークはどのように生まれるか」という問いを設定し、ネットワーク形成モデルを提案、推定しています。

この問いに答えるため、名刺アプリ「Eight」のユーザー間ネットワークデータを用います(※1)。Eightでは、名刺交換した相手の名刺を撮影することでその情報をデータ化し管理ができます。そして名刺交換した相手もまたEightユーザーであるならば、両者はEight上でつながります。本研究で用いるネットワークデータとは、そうした紙の名刺交換を通じて「対面で」つながったユーザー間のネットワークです。こうした対面でのつながりを捉えたデータは他にありません。加えて名刺交換はほとんどの場合初対面のときに行われるため、ビジネスネットワークの発生起源を解明する上で適したデータと言えます。

本研究で考えるネットワーク形成モデルは、ネットワークの各個人がいずれかの観察されないコミュニティーに属していると考えます。そして、コミュニティーの中でつながる確率は共通の友人の存在など他のユーザーの存在が影響を与える一方で、コミュニティーをまたぐつながりは偶然の要素が強いと考えます。このモデルを推定するために、第一段階では各個人の特徴量を用いながらコミュニティー構造を検出します。そして第二段階で、その検出されたコミュニティーを所与として、つながりに影響を与えるパラメーターを推定します。

推定の結果、以下が明らかとなりました。
・推定されたコミュニティー構造は、ネットワークでより密につながっている箇所を特定している。
・ユーザーの属性が一致する場合、両者はよりつながりやすい。
・共通の友人がコミュニティー内で存在するとき、またはより多くのユーザーコミュニティー内でつながっているときほど、あるユーザー同士はつながりやすい。

特に最後の点である、第三者が当事者同士のつながりやすさへ与える影響を考慮しながら、大規模なネットワークでモデルを推定することは、これまでほぼ不可能とされてきました。ソーシャルネットワークでしばしば観察されるコミュニティー構造を考え、コミュニティー内外でのつながり方が異なると仮定することで、その推定を可能にしています。

名刺アプリ「Eight」のユーザー間の名刺交換ネットワークにlighthergmを用いてコミュニティーを推定して色分けした図(ワーキングペーパー(※2)より抜粋)

考えるモデルを工夫することに加えて、本研究では計算時間を削減するアルゴリズムを提案しています。特に計算負荷の大きい部分が行列演算によって計算できることを示し、単純に実装する場合と比較して約14,000倍の高速化を実現しました。

今後について
今回の共同研究の成果は、2021年11月に開催される「Southern Economic Association 91st Annual Meeting (※3)」にて報告予定です。

今後は、当社が提供する名刺アプリ「Eight」の機能改善に活用し、アプリ内のフィードコンテンツのレコメンデーションへの応用などを想定しています。さらに、企業名やユーザー名を匿名化したビジネスネットワークを解析し、反実仮想シミュレーションを行うことで、行政機関に対して研究結果を政策の評価・検証などに重要な関連を持つ情報やデータ(エビデンス)として提供し、行政機関による政策立案やその実施を後押しするEBPMの取り組みを支援することを見据えています。

■「lighthergm」の取得先
「lighthergm」ライブラリおよびワーキングペーパー「A Structural Model of Business Card Exchange Networks」は、次のURLにて公開されています。

・lighthergm
https://github.com/sansan-inc/lighthergm

・ワーキングペーパー
Dahbura, J. N. M., Komatsu, S., Nishida, T., & Mele, A. (2021). A structural model of business cards exchange networks. arXiv preprint arXiv:2105.12704.
https://arxiv.org/abs/2105.12704

※1:分析に当たっては、Eightのデータについて個人を匿名化し、2019年1月1日から2019年12月31日までにEightのユーザーによって登録された名刺の情報を、Eightの利用規約で許諾を得ている範囲で使用しました。

※2:Dahbura, J. N. M., Komatsu, S., Nishida, T., & Mele, A. (2021). A structural model of business cards exchange networks. arXiv preprint arXiv:2105.12704.
https://arxiv.org/abs/2105.12704

※3:Southern Economic Association 91st Annual Meeting
https://www.southerneconomic.org/conference/

(以上)

DSOCについて
DSOCは、Sansan株式会社のデータ統括組織です。データドリブンによって企業の事業成長をリードすることを目的として、「データ化」「データ活用」という2つの役割を担っています。独自開発のAIを活用したデータ化技術により膨大な「出会い」を正確にデータベース化し、それを分析・活用することで、企業の情報、人物の情報、人と人のつながりの情報など、ビジネスシーンで活用できる「価値ある情報」を生み出します。そして、その成果はサービスを通じて新しい価値として提供しています。多様なバックグラウンドや専門領域を持つ研究者やデータサイエンティストなどのR&Dメンバーを擁するDSOCは、サービスを支えるとともに企業の事業成長を牽引します。
https://sansan-dsoc.com

Sansan株式会社 会社概要
「出会いからイノベーションを生み出す」をミッションとして掲げ、ビジネスにおける出会いを後押ししています。主なサービスとして、クラウド名刺管理サービス「Sansan」や名刺アプリ「Eight」、クラウド請求書受領サービス「Bill One」を国内外で提供しています。

設立:2007年6月11日
URL:https://jp.corp-sansan.com
所在地:150-0001 東京都渋谷区神宮前5-52-2 青山オーバルビル13F
資本金:63億12百万円(2021年5月31日時点)
事業内容:働き方を変えるDXサービス(クラウド名刺管理サービス等)の企画・開発・販売
Sansan https://jp.sansan.com
Eight https://8card.net
Bill One https://bill-one.com
 

このプレスリリースには、メディア関係者向けの情報があります

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。※内容はプレスリリースにより異なります。

すべての画像


ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

Sansan株式会社

134フォロワー

RSS
URL
https://jp.corp-sansan.com/
業種
情報通信
本社所在地
東京都渋谷区桜丘町1-1 渋谷サクラステージ 28F
電話番号
03-6758-0033
代表者名
寺田親弘
上場
東証プライム
資本金
-
設立
2007年06月