「音源分離」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音源分離』を8月24日に発売

インプレスグループでIT関連メディア事業を展開する株式会社インプレス(本社:東京都千代田区、代表取締役社長:小川 亨)は、「音源分離」技術の基礎から実装までを解説した書籍『Pythonで学ぶ音源分離 機械学習実践シリーズ』を2020年8月24日(月)に発売いたします。


■身近なものにも活用される技術「音源分離」の基礎と実装を解説する一冊
近年、AIスピーカをはじめとした、人が話した音声を理解する音声認識システムがさまざまな場面で使われています。一般的に音声認識システムは、1人の声を聞き取ることを想定しており、聞きたい声以外の音が入ってきたときには、聞きたい声を正確に聞き取ることが難しくなります。「音源分離」とはこのようにさまざまな音が混ざった中から、欲しい音だけを抽出する技術です。本書では、音源分離の基礎から、Pythonを用いた実装までを詳しく解説しています。

■音源分離に必要不可欠な数学の基礎知識も網羅
音源分離を理解しコードを書くためには、プログラミングに関する知識に加え、線形代数、微分・積分、確率・統計といった数学的知識も必要不可欠です。本書では、線形代数や行列・ベクトルの微分の方法、確率統計の基礎について示しています。とくに音源分離では複素数の行列・ベクトルを用いるため、複素数の計算方法について重点的に解説しています。

■音源分離の実装に必要な準備段階の情報も丁寧にカバー
本書では第1章から第4章までを音源分離を扱うための準備の章としています。

第1章は、音源分離とはどういった技術なのか、具体例を提示しながら解説しています。第2章は、音声処理の基本として、音声ファイルの構造と、Pythonパッケージを用いて音声ファイルを開閉する方法を示しています。第3章は、音源分離で必要な、線形代数や行列、ベクトルの微分の方法、確率統計の基礎について示しています。第4章は、第3章の数学的知識をベースに、最適化に関する手法を示しています。

第5章からは音源分離の実装について解説します。第5章では、Pyroomacousticsというライブラリを用いて仮想的に設定した部屋で収録した音声をシミュレートする方法を紹介しています。第6章では、ビームフォーミングという手法を解説しています。第7章は、空間モデルのパラメータを、音源方向の推定結果を利用して求める方法を示しています。第8章は、ブラインド音源分離法について紹介しています。第9章は、残響除去の方法を示しています。第10章は、残響除去と音源分離を統合的に実行する方法を解説しています。第11章は、PyroomacousticsやNARA-WPEなどのツールや参考文献を紹介しています。

〈本書はこんな人におすすめです〉
  • 音声処理のエンジニア、研究者
  • 理系の大学生
  • Pythonで音源分離を実装したい人

■紙面イメージ
 

「音源分離とは何か?」から丁寧に解説しています「音源分離とは何か?」から丁寧に解説しています


NumPySciPyを用いた方法や、スペクトログラムの見方も詳しく解説していますNumPySciPyを用いた方法や、スペクトログラムの見方も詳しく解説しています


■書籍の詳細

書名:Pythonで学ぶ音源分離 機械学習実践シリーズ
著者:戸上真人
発売日:2020年8月24日(月)
ページ数:352ページ
サイズ:B5変型判
定価:本体3,500円+税
電子版価格:本体3,500円+税 ※インプレス直販価格
ISBN:978-4-295-00984-9


◇Amazonの書籍情報ページ:https://www.amazon.co.jp/dp/4295009849/
◇インプレスの書籍情報ページ:https://book.impress.co.jp/books/1119101154


■著者プロフィール
戸上真人(とがみ・まさひと)
2017年1月~2018年5月、スタンフォード大学のStanford Data Science Initiative (SDSI) Visiting Scholarとして在籍。2018年6月にLINE株式会社入社。現在、同社のAI研究組織であるData LabsのSpeech TeamのManager兼Principal Researcher。(一社)人工知能学会理事。16年以上に渡り、音声処理の研究開発に従事。東京大学工学系研究科より2011年に博士(工学)授与。登録特許20件以上、査読あり論文9件、査読あり国際会議での採択論文数60件以上。IEEE Senior Member。

■「機械学習実践シリーズ」とは
本書を通して「実際に動くものが作れる」ことを目指して、特定の技術のアルゴリズムと、それを実装するためのコードを豊富に紹介するシリーズです。機械学習の基本から実装までを学ぶことができます。


以上


【株式会社インプレス】 https://www.impress.co.jp/
シリーズ累計7,500万部突破のパソコン解説書「できる」シリーズ、「デジタルカメラマガジン」等の定期雑誌、IT関連の専門メディアとして国内最大級のアクセスを誇るデジタル総合ニュースサービス「Impress Watch」等のコンシューマ向けメディア、「IT Leaders」、「SmartGridニューズレター」、「Web担当者Forum」等の企業向けIT関連メディアブランドを総合的に展開、運営する事業会社です。IT関連出版メディア事業、及びデジタルメディア&サービス事業を幅広く展開しています。

【インプレスグループ】 https://www.impressholdings.com/
株式会社インプレスホールディングス(本社:東京都千代田区、代表取締役:松本大輔、証券コード:東証1部9479)を持株会社とするメディアグループ。「IT」「音楽」「デザイン」「山岳・自然」「モバイルサービス」「学術・理工学」「旅・鉄道」を主要テーマに専門性の高いメディア&サービスおよびソリューション事業を展開しています。さらに、コンテンツビジネスのプラットフォーム開発・運営も手がけています。

すべての画像


ダウンロード
プレスリリース素材

このプレスリリース内で使われている画像ファイルがダウンロードできます

会社概要

URL
https://www.impressholdings.com
業種
情報通信
本社所在地
東京都千代田区神田神保町1-105 神保町三井ビルディング
電話番号
03-6837-5000
代表者名
松本 大輔
上場
東証スタンダード
資本金
53億4102万円
設立
1992年04月