構造化学の研究を先導する100万件のビッグデータ

Cambridge Structural Databaseに収録された結晶構造が100万件に到達し、構造データの創薬や材料開発への利用の可能性がさらに拡大

化学情報協会は、英ケンブリッジ結晶学データセンター (The Cambridge Crystallographic Data Centre, CCDC) が発表したプレスリリースを受けて、国内向けに次のとおり、お知らせいたします。CCDCからの発表情報は下記をご覧ください。
https://www.ccdc.cam.ac.uk/News/List/the-cambridge-structural-database-reaches-one-million/
【英国ケンブリッジ発、2019年6月6日】 構造化学データや材料科学・生命科学研究用ソフトウェアの分野で指導的役割を果たしている CCDC (The Cambridge Crystallographic Data Centre) は、構造化学における金字塔として、ケンブリッジ結晶構造データベース (Cambridge Structural Database, CSD) に100万件目の構造が登録されたことを発表しました。

CSDは、実験により決定され吟味された有機および有機金属結晶構造の世界的リポジトリで、固体内で分子が三次元的にどのように配列し相互作用するか、さらにその分子配列が固体としての物性にどのように影響するかを知るために、全世界70ヶ国以上の研究者に利用されています。

機械学習とオートメーション化が医薬、農薬、その他多くの産業のあり方を変革しつつあり、いわゆる「ビッグデータ」への関心が高まっている現在、この意義深いマイルストーンに到達したことはCCDCにとっても、このリソースの情報源であり利用者でもある科学コミュニティにとっても、顕著な業績といえます。

このように膨大なデータを利用することで、研究者は広範かつ多様な情報から一層豊富な知見を引き出すことができ、データから得られた結論の信頼性が高まることにつながります。さらに、CCDCはCSDに収録するデータに対し、各工程で厳格に品質管理を行っており、これによって最高品質の情報が研究に利用できることになります。

CCDCの提供する豊富なデータと高度な検索・3Dデータマイニング・分析・可視化の機能を持つソフトウェアを利用することで、産業界・学術界を問わず、研究の推進や新知見の予測が一層効果的になります。またCSDから得られる知識は計算化学や分子モデリングの基礎として、産業界では新薬の開発・製造において、学術界では化学教育において信頼を得ています。

CCDCのCEOを務めるDr. Jürgen Harterは「これはCCDCばかりでなく科学コミュニティ全体にとっても重要な金字塔です。このような巨大なデータ集合が研究や意思決定の助けとなっていることに加え、我々のデータベース・チームの努力によってデータの高い品質を維持していることも私たちが誇りとするところです。データを厳格に吟味する方針を堅持することによって、CSDから引き出されるさまざまな知見の価値が保証され、誤った情報による時間・資源・費用の無駄を避けることができます」とコメントしました。

CCDCの発表によれば、この100万件目の構造はN複素環式化合物で、複数の反応段階を順次活性化するカルコゲン結合触媒を用いて得られたものです。原著論文には一群の特殊なカルコゲン結合触媒が報告されており、これにより小さい分子を組み立てる方法でN複素環式化合物を極めて効率的に合成することができます。この構造を決定した山東大学(中国)のYao Wangらの論文は、Journal of the American Chemical Society (JACS) に発表されました。

CSD Refcode XOPCAJ (DOI 10.5517/ccdc.csd.cc20vdhs)
CSDに100万件目として登録された構造

 

CSDの責任者Suzanna Wardは「Yao Wangと共著者が100万件目の構造を発表したことをお祝いするとともに、データを提供してくれた世界35万人以上の研究者にも感謝しています。この偉業をなしえたことも、“構造データと言えばCSD”と信頼を獲得しえたことも皆様のおかげです」と述べました。

Dr. Wangは「我々の発表した1-(7,9-diacetyl-11-methyl-6H-azepino[1,2-a]indol-6-yl)propan-2-one (CSD Refcode: XOPCAJ) がCSDの100万件目に登録されたことを喜んでいます。我々はCSDを10年以上利用していますが、それはCSDが新しい結晶構造を報告するための優れたプラットフォームであり、発想のもととなる化学構造を見出すのに最適なデータベースであるからです。我々を含めて世界の多くの研究者にとって価値ある資源であるCSDの記念すべき大きな節目に寄与できたことは我々の誇りとするところです」と語りました。

JACSのPeter Stang編集長は次のように話しています。「JACSに発表された構造がCSDの100万件目の登録データであったのは嬉しいことです。CSDが構造データの信頼し得るリポジトリであることはJACSの読者には周知のことで、このリソースが科学研究を促進することもいくつかの論文で実証されています。CCDCと我々の継続的な協力関係によって、この豊富なデータの利用が一層容易になり、また我々の雑誌に発表されるデータの信頼性が保証されることになります。我々はこのような重要な節目に関われたことを誇りに思います。」

Dr. HarterはCSDの次の計画に関する質問に答えて、CSDの利用は医薬・農薬産業では既に十分確立されているのに対して、電池・塗料・顔料・染料などの分野での材料の研究、特にガス貯蔵物質やテーラーメード触媒の開発においては、基本的なリソースとしての認知が急速に高まっている状況であることを指摘しました。環境汚染問題やサステイナビリティの重要性がますます高まるなか、グローバルに見たCSDの潜在的需要には極めて大きなものがあります。

また、中国で行われた研究の登録件数が継続的に増えていることをCCDCは指摘しています。

「中国のような大市場を持つ国が生命科学・材料開発の研究で科学的発見を先導する興味深い時代です。このような市場の動向から何が読み取れるかに強い関心を持っています」とDr. Harterは述べています。

CCDCではデータから得られる知見や傾向を活用して、各産業分野において将来の研究動向に刺激を与える計画を進めています。

100万件達成に関する詳しい情報は,特設サイト https://www.ccdc.cam.ac.uk/csd-1-million/  をご覧ください。

【CCDCについて】

CCDCは構造化学データとそれに基づく生命科学・材料科学の研究と応用のためのソフトウェアを主導する専門機関です。CCDCは化学・結晶学の発展を通じて公衆の利益を図ることを使命としており、創薬、材料開発、研究、教育のために利用される結晶構造データの構築・保存・活用に特化した活動を行っています。

CCDCが作成・提供するケンブリッジ結晶構造データベース (Cambridge Structural Database,  CSD) は、十分な吟味と整理を経た有機化合物および有機金属化合物の結晶構造のデータベースとして全世界の研究者に利用されています。CCDCの最新のソフトウェアは大規模なデータ集合から価値ある知見を引き出すことで研究開発の促進を助けるツールです。

▽詳しくは https://www.ccdc.cam.ac.uk/ をご覧ください。

【化学情報協会(略称:JAICI)について】

化学情報協会は、化学技術情報の流通を図るため 1971 年に設立されました。米国をはじめ世界各国の情報機関と協力関係を築き、日本の研究者をサポートする情報センターとして、大学・企業などの情報取得・分析から研究・開発までを支援しています。また、1981年以来、CCDCの国内代理店として、会社等営利機関向けにCCDCのサービスを提供しています。
▽詳しくは https://www.jaici.or.jp/ をご覧ください。
このプレスリリースには、メディア関係者向けの情報があります。

メディアユーザー登録を行うと、企業担当者の連絡先や、イベント・記者会見の情報など様々な特記情報を閲覧できます。
※内容はプレスリリースにより異なります。

  1. プレスリリース >
  2. 化学情報協会 >
  3. 構造化学の研究を先導する100万件のビッグデータ