Blog
ブログ

2020年06月04日

第13回社内勉強会

5月29日、5月最後の平日であるこの日、13回目となる勉強会が開催されました。

テーマは「WebRTC」、そして、「AIと芸術」でした。

ブラウザー間での通信を実現させるWebRTC。

そして近年注目を集める、AIによる芸術、創作について。

この春に入社した、新入社員のお二人から発表が行われました。

WebRTC

WebRTC(Web Real Time Communication)とは、Webブラウザ間でリアルタイムなコミュニケーションを実装することを目的としたオープンソースプロジェクトです。

これを実現するために、P2PやICEといった技術が利用されています。

P2P通信

そもそもP2P(Peer-to-Peer)通信とは、特定のサーバーを介さずに、端末同士がやりとりをする通信方式のことです。

一般に、ネットワークというと、中心となるサーバーがあって、そのサーバーを介してクライアント同士がやりとりをする、いわゆるclient-server型のネットワークが思い浮かぶかもしれません。

しかし、P2P通信とは、クライアント同士がサーバーを介さずに直接やり取りする通信方式のことです。

Signalingサーバー

P2Pでは、接続したい端末のIPアドレスといった、接続相手の情報が既知である必要があります。

そこで、多くの場合、通信者同士の情報を交換する(シグナリング)ためのサーバを用意しておくことが一般的です。

これをSignalingサーバーといいます。

ちなみにWebRTCでは、Signalingサーバーとクライアント間の通信方式は特に定められていません。

このSignalingサーバーを経由して、クライアントは通信相手と接続するための情報を送受信することができます。

ICE

実際に、クライアント同士での通信を実現させるために、WebRTCでは、ICEというフレームワークを利用しています。

ICEは、通信したいクライアント同士の、あらゆるネットワークの状況を想定し、接続を試みるためのフレームワークです。

例えば、同一ネットワークに所属しているなどの特殊な場合を除いて、通信者同士はそれぞれ別のNAT配下にいることがほとんどでしょう。この場合は、NATを超えて通信をする必要があります。

ICEにおいて、これを実現するために登場してくるのが、StunサーバーとTurnサーバーです。

Stunサーバーは、リクエストを送ると、外側(インターネット)から見た自分のIPを返すサーバーです。

ICEではまず、Stunサーバーから返ってきたIPを使い、クライアント同士の通信を試みます。

これでも接続ができなかった場合は、Turnサーバーを経由して接続を試み、以後全ての通信をTurnサーバー経由で行います。

勉強会では、社員によるWebRTCのサンプルを使った実演が行われました。

AIと芸術

音楽生成サービス

ここで、作品一般の創作の流れを仮に「創作」→「編集」→「発表」とします。

音楽について当てはめてみると、「（作詞）作曲」→「編曲」→「演奏・音源配信など」となります。

すでに、この各段階に関わるAIサービスが存在しており、以下のようなものがあります。

Amper Music

ジャンル、曲の雰囲気、長さを指定することで、楽曲が自動生成される。

BGMを作るのに向いており、大手通信社ロイターのサービスにも採用された。

Amadeus code

日本語による自然言語処理技術を音楽に応用した機械学習アルゴリズム群を利用した自動作曲AI。

iOSのスマホアプリとして提供されており、アプリ版では、歴史上のヒット曲600曲をAIに学習・分析させたデータベースを使い、メロディに特徴量を付与して生成している。

ローマ教皇の来日イベントである「POPE IN JAPAN 2019」のオフィシャルテーマソング「PROTECT ALL LIFE　〜時のしるし〜」の作曲にも使われた。

AWS DeepComposer

専用キーボードもしくはコンソールによってメロディを入力し、ジャンルを選択すると、事前トレーニング済みモデルによって自動で編曲してくれるAI（作曲ではない）。

GANを使って伴奏を生成し、独自のモデルを作成することもできる。

楽曲制作のほか、AWS DeepComposerを通して機械学習について学習する「ラーニングカプセル」というサービスも提供している。