OpenAI 发布了深度神经网络 MuseNet,使用者可以用 10 种不同的乐器,结合乡村、莫札特或 Lady Gaga 等音乐风格,制作长度四分钟的音乐作品。不过,OpenAI 并没有教 MuseNet 乐理或是编曲理论,而是让人工智能从几十万个 MIDI 档案中学习,探索合声、节奏和风格等乐曲的元素。
MuseNet 使用的是与 GPT-2 相同的通用无监督技术,这是一种大规模的 Transformer 模型,训练之后可用来预测乐曲中后面的音符。OpenAI 还从不同来源收集了多种音频资料,作为 MuseNet 的训练数据,其中包括 ClassicalArchives 和 BitMidi 的网站文件、MAESTRO 数据集,还有网络上的流行、非洲、印度和阿拉伯风格的音乐文件。
为标记时间推移,OpenAI 进行了各种试验,最终找到了一种有表现力且简洁的编码方式,可以将音调、音量和乐器等信息组合成单一的 token。在训练过程中,OpenAI:
通过升高或是降低音调来置换音符
借由调高或是调低各种样本的整体音量,以达到强化音量效果的效果
通过加速与减慢达成强化乐曲时间上的变化
目前,OpenAI 已将早期成果公开,使用者可以在 MuseNet 中指定作曲家或是风格。在选择某个著名的音乐作品作为开头后,网站便会创造出新的音乐作品。MuseNet 公开的时间会持续到 5 月中旬,之后该功能会下线并根据用户反馈进行调整。
评论删除后,数据将无法恢复
AI 也能作曲!OpenAI 发布音乐生成神经网络 MuseNet
OpenAI 发布了深度神经网络 MuseNet,使用者可以用 10 种不同的乐器,结合乡村、莫札特或 Lady Gaga 等音乐风格,制作长度四分钟的音乐作品。不过,OpenAI 并没有教 MuseNet 乐理或是编曲理论,而是让人工智能从几十万个 MIDI 档案中学习,探索合声、节奏和风格等乐曲的元素。
MuseNet 使用的是与 GPT-2 相同的通用无监督技术,这是一种大规模的 Transformer 模型,训练之后可用来预测乐曲中后面的音符。OpenAI 还从不同来源收集了多种音频资料,作为 MuseNet 的训练数据,其中包括 ClassicalArchives 和 BitMidi 的网站文件、MAESTRO 数据集,还有网络上的流行、非洲、印度和阿拉伯风格的音乐文件。
为标记时间推移,OpenAI 进行了各种试验,最终找到了一种有表现力且简洁的编码方式,可以将音调、音量和乐器等信息组合成单一的 token。在训练过程中,OpenAI:
通过升高或是降低音调来置换音符
借由调高或是调低各种样本的整体音量,以达到强化音量效果的效果
通过加速与减慢达成强化乐曲时间上的变化
目前,OpenAI 已将早期成果公开,使用者可以在 MuseNet 中指定作曲家或是风格。在选择某个著名的音乐作品作为开头后,网站便会创造出新的音乐作品。MuseNet 公开的时间会持续到 5 月中旬,之后该功能会下线并根据用户反馈进行调整。