MuPT: 音楽生成のための事前学習トランスフォーマー

4月 10 2024

解説

AMI HAPPY

ねえ智也、この「MuPT: A Generative Symbolic Music Pretrained Transformer」って論文、何についてなの？

TOMOYA NEUTRAL

ああ、これは音楽の事前学習に大規模言語モデルを適用することを探求した研究だよ。特に、ABC記譜法という音楽の記譜法がLLMsと相性がいいことを見つけたんだ。

AMI CURIOUS

ABC記譜法って何？

TOMOYA NEUTRAL

ABC記譜法は、音楽をテキスト形式で表現する方法の一つで、特にフォーク音楽や伝統音楽によく使われるんだ。

AMI SURPRISED

へえ、じゃあどうやってそれを使ってるの？

TOMOYA NEUTRAL

この論文では、複数のトラックが同期しているABC記譜法を提案していて、音楽の一貫性を保ちながら生成することができるんだ。

AMI CURIOUS

それで、結果はどうだったの？

TOMOYA HAPPY

非常に有望で、音楽生成のための新しい方向性を示しているよ。さらに、オープンソースで研究コミュニティに貢献しているから、多くの人がこの技術を使って新しいことができるんだ。

AMI HAPPY

わあ、すごいね！音楽のロボットが作曲家になっちゃう日も近いかもね！

TOMOYA NEUTRAL

まあ、そうなるかもしれないね。でも、まだ解決すべき課題も多いから、研究はこれからが本番だよ。

この論文では、音楽の事前学習に大規模言語モデル（LLMs）を適用することを探求しています。

MIDIの使用が一般的ですが、ABC記譜法がLLMsの設計と強みにより密接に合致していることがわかりました。

異なるトラックからの不整合な小節を解決するために、同期マルチトラックABC記譜法（SMT-ABC記譜法）を提案します。

8192トークンまで扱えるモデルのシリーズを開発し、訓練セットの90%の象徴的音楽データをカバーしています。

シンボリックミュージックスケーリング法則（SMS法則）のモデル性能への影響を探りました。

音楽生成の将来の研究に有望な方向を示しており、コミュニティ主導の研究に広範なリソースを提供しています。

投稿日:AI