2015年のE3でトレーラーが初公開され、全世界のファンを熱狂させた『FINAL FANTASY VII REMAKE』(以下『FF7 リメイク』)。あれから5年後の2020年4月10日に全世界同時発売された同作は、2020年8月時点で全世界累計出荷・DL版販売本数500万本突破の大ヒット作となっている。
その『FF7 リメイク』について、2020年9月2日から4日にかけてCESA(一般社団法人コンピュータエンターテインメント協会)が主催するゲーム開発者向けイベント「CEDEC 2020」にて、「すべてを出し尽くせ!FINAL FANTASY VII REMAKEにおける泥沼サウンド制作秘話」と題したセッションがイベント初日の9月2日に行われた。
同講演にはリードオーディオプログラマーの谷山輝氏、サウンドディレクターの伊勢誠氏、ミュージックスーパーバイザーの河盛慶次氏の3名が登壇。ゲームをプレイしただけではなかなか伝わらない・感じられない部分について、サウンド制作の舞台裏と合わせてそれぞれの立場から語った。
なお、2020年のCEDECは新型コロナウイルスの影響により、初のオンライン開催となっている。
取材・文/桑原健太郎
サウンドチームのテーマは「懐かしさと新しさを融合させた表現の追求」
最初に登壇したサウンドディレクターの伊勢誠氏はまず、『FF7 リメイク』でサウンドチームが目指したものについて語った。
伊勢氏:
そもそも『FF7 リメイク』とはどういうものかと言うと、1997年にプレイステーションで発売された『FINAL FANTASY VII』を、現在の技術によってリメイクすることを主題として制作されたタイトルです。その制作において私たちサウンドチームもテーマを持って開発にあたりました。
そのテーマというのが「オリジナルをリスペクトしつつ、プレイしたことがない人でも楽しめる、懐かしさと新しさを融合させた表現の追求」です。大事な部分を活かしつつ、今だからこそできるサウンド作りを目指したという感じですね。
『FF7 リメイク』は最新のグラフィックス表現に加えて、当時あったような場面転換をほとんど含まない、シームレスに展開するストーリー主体のコマンド主体型のアクションRPGになっています。フィールドからバトル、カットシーンからそのままバトルへシームレスに物語が展開していきます。
そうした新しさに対して、内製のサウンドドライバーの最新機能をフル活用して、曲・効果音・ボイス全てにおいてサウンドのインタラクティブ性にこだわったものが今回の『FF7 リメイク』であると言えます。
『FF7 リメイク』のサウンドを支えるサウンドドライバー「SEAD」
続いてはリードオーディオプログラマーの谷山輝氏が登壇。スクウェア・エニックスが擁するサウンド制作環境や、それらが『FF7 リメイク』でどのような役割を果たしたかを解説した。
スクウェア・エニックスでは、SEAD(SQUARE ENIX Audio DRIVER、シード)と呼ばれる自社製のサウンドドライバーを開発しており、同社のモバイルからハイエンドなコンソールゲームまで、様々なタイトルで使用されているという。そのSEADの機能の中で、『FF7 リメイク』で要となった3つの機能がMAGI(マギ)、MASTS(マスツ)、ZeroOne(ゼロワン)である。
シームレスな動的音楽再生を実現する「MAGI」
MAGIとは「Music API for Gaming Interaction」の略称で、シームレスな動的音楽再生のためのAPI。従来、任意のタイミングでの単純なクロスフェードでのみ曲を切り替えていたものを、MAGIでは切り替える曲同士のテンポや小節といった音楽的な構造を加味し、多彩な音楽切り替えパターンを実現する。
MAGIによって可能な切り替えパターンは大別して「セクション遷移」と「モード遷移」の2つ。
セクション遷移とは、現在鳴っている曲と切り替えようとしている曲のお互いのテンポ・小節を加味して、切り替わりにふさわしいタイミングをリアルタイムで探し、同期待ちしながら波形をクロスフェードすることで自然に切り替えるパターン。
モード遷移とは、あらかじめ音楽的に同期した波形を同時に並べておいて、任意のタイミングで各トラックのボリュームを同時に変化させ、クロスフェードすることで自然に切り替えるパターン。
これらを駆使することで、さまざまなデータに対してまるでひと繋ぎかのような動的でシームレスな曲の切り替えを実現しているという。
キャラクターの動作音を自動で鳴らす「MASTS」
MASTSとは「Motion-Controlled Real-Time Automatic Sound Triggering System」の略称で、リアルタイムなモーション解析に基づいてキャラクターの動作音を自動で鳴らす仕組み。
MASTSではキャラクターの骨の位置情報と設置状態を毎フレーム取得し、リアルタイムで歩きやジャンプといったキャラクターの動作状態を推定しつつ、その結果から足音や衣擦れなどの動作音を選択し、各部位に貼り付けて発音を行うことができる。
従来であればモーションごとに大量のトリガーを埋めこんだり、それに対応した音を指定して鳴らしていたのが、MASTSではあらかじめプログラムの接続とデータセットの用意さえしておけば、自動で動作音を鳴らすことができるようになるという。
シーンに応じてサウンドを動的に変化させられる「ZeroOne」
ZeroOneとは動的なサウンド変化のための仲介パラメータのこと。実は昔から実装されている機能だったが、今回の『FF7 リメイク』において非常に重要な役割を果たしたという。
ZeroOneを使用すると、ゲームから取得した情報をまとめて、サウンドにリアルタイムに通知することができる。各シーケンスに与えられるZeroOne値には、ボリュームやピッチなどの音声パラメータに変化して渡せるカーブを持てるようになっている。
さらにZeroOneはサウンドに複数の設定をすることができ、組み合わせによってより複雑に音を変化させることもできる。これにより、動的に多様に鳴り変わるサウンドが作れるようになっているという。
ここで具体例として、伍番街スラム・闘技場のガヤの動画が公開された。盛り上がりぶりの異なる4つのループ波形を準備し、シーンの盛り上がり度に応じて外部からZeroOneの値を変えるだけで、リアルタイムで多様に鳴り変わるガヤを作ることができる。
MAGIによるインタラクティブミュージック、MASTSによるキャラクター動作自動発音、ZeroOneによるインタラクティブSE、これらスクエニならではの技術を使い、それらを組み合わせてインタラクティブ性を重視し随所に盛り込んだのが『FF7 リメイク』のインタラクティブサウンドだという。
BGM制作のスタートはオリジナルのサウンドを振り返るところから
続いては実際のサウンド制作についての解説を、ミュージックスーパーバイザーの河盛慶次氏が行った。
『FF7 リメイク』のBGM制作にあたっては、オリジナルのサウンドを振り返るところから始めたという河盛氏。初代プレイステーションからグラフィックが圧倒的に向上し、視覚的情報量も増えたプレイステーション4の環境で、BGMだけが昔と同じようにいつも同じテンションで鳴り続けるというのはどうなんだろうと、“BGMの立ち位置”を考えたところから制作が始まったという。
そして色々とテストを繰り返すなかで、「チャプター丸ごと、シチュエーションやカットシーンに合わせてシームレスに曲を切り替え、ほぼ音楽を鳴らし続ける」というコンセプトで、八番街のチャプターでテスト制作をすることになったという。
「音楽設計会議」でイメージを共有
テストで手応えを感じたサウンドチームは、この仕様で全体を作っていくことに決定。一方で、シームレスに切り替えるのは滑らかな反面、バトルの入りなどでインパクトが減ってしまうこともあるため、シチュエーションによってはバトル曲を頭から再生したり、フックとなるセクションを足すことにも留意したという。
このようにして制作方針は決まったものの、全編この方法で作るには膨大なリソースが必要なのはもちろんのこと、緻密な事前設計が必要だった。そこでBGM制作前のイメージ共有を強化するため、伊勢氏、河盛氏に加え、『FF7 リメイク』のディレクターである鳥山求氏の3名で「音楽設計会議」を行ったという。
今までのBGM制作では、プランナーなどが制作したBGMリストから作業を始めていたが、『FF7 リメイク』ではBGMリストに落とし込む前にひとつのチャプターを丸ごとキャプチャー。音楽設計会議では、そこにディレクター鳥山の指示に従って仮でBGMを高い精度で当て込み、その動画を鳥山・伊勢・河盛の3氏で最初からプレイ感覚で確認し、イメージを共有した。
会議で作成した動画はシームレスに切り替わるBGMのイメージをチームや作家と共有するのに役立っただけでなく、発注内容の精度も上がり、後々のイメージの食い違いで起こる作業の手戻りも少なくなったという。
シームレスなBGM制作で大事にしたこと
シームレスにBGMを制作するうえで大事にしたこととして河盛氏は、「シームレスに曲を切り替えるとしても、ファイナルファンタジーの楽曲が持つメロディーは大事にすること」を挙げた。シームレスに切り替えやすいようにむやみにメロディーをなくしたりせず、曲によっては切り替わりポイントをメロディーの区切りのよいところまで待つようにするなどしたという。
また、カットシーン曲(特定のイベントシーンなどで鳴る曲)をその手前のユーザー操作部分から流し始め、カットシーンに綺麗に繋がるようにイントロ的にBGMを始めたりもしている。シーンによっては4、5回曲が切り替わることもあるため、「どこを一番聞かせたいか」をよく考えて設計する必要もあったそうだ。
インタラクティブミュージックの使い方に「特別」はない
ここまでをまとめて河盛氏は以下のように語った。
河盛氏:
インタラクティブミュージックの使い方としては特別な何かがあるとは思っていません。ピンポイントで使用していたシームレスに音楽をつなぐことを、広範囲にたくさん積み重ねたのが『FF7 リメイク』のインタラクティブミュージックの特徴であると言えます。
そして『FINAL FANTASY VII』の音楽が23年間ファンの方々に愛されたという土台があってこそ、リメイクでたくさんのアレンジのバリエーションを作成することができたとも思っています。
今後もシームレスな作りのゲームは増えていくかと思いますが、本当にそのゲームで頻繁にBGMが切り替わることが有効なのか、シームレスに切り替える対応しても印象に残る音楽を制作するのはどうすればいいのか、という点をしっかり考えて制作していくことが大事だと思っています。
『FF7 リメイク』制作で大幅な進化を遂げたMASTS
続いては、MASTSを使ったキャラクター動作音の解説。伊勢氏によると、これまでのMASTSには大きく2つの課題があったという。
ひとつめは、キャラクターの動作検出判定式の調整がデザイナーではなくプログラマーのタスクになっていたこと。理由は動作の検出判定が非常に難しく、デザイナーが理解しにくかったからだという。そしてもうひとつが、従来のMASTSでは基本的にリアルタイムのモーションのみが適用対象になっており、イベントなどのカットシーンはサポート範囲外だったことだ。
そこで『FF7 リメイク』ではMASTSを改良。プログラマーが担当していた個別のパラメーター調整を廃止し、サウンドデザイナー主導で動作判定式を調整設定できるように拡張。また、デザイナー目線で調整しやすいようにアルゴリズムを工夫して設定をアセット化したほか、キャラクターの動きの個性に対応するためにキャラごとに設定できるようにもした。さらにカットシーンでの緻密な動作表現のために動作種を大幅に追加。これらの大幅改良により、ほぼ全編をMASTSで制作可能になったという。
これに加えて今までは歓声などの比較的大きなくくりでのみ使用していたZeroOneを、動作種のような細かいサウンドにも適用したことで、カットシーンでの自動発音化を実現できたのだという。
新たに改良したMASTSを導入したことで、カット新制作における大幅なコスト削減をはじめ、サウンド制作のさまざまな部分で作業削減を実現。また、MASTSのみの自動発音で完結できるケースが増えたことで、キャラクターのモーションやスピード変更、カメラの視点変更やシーンの尺変更などの影響を受けにくくなり、作業的にも精神的にも非常に楽になったという。
『FF7 リメイク』のダイナミックな空間表現
一方、『FF7 リメイク』では空間表現についてもよりインタラクティブに表現することを大事にしていると谷山氏が語る。
特製のオーディオボリューム
『FF7 リメイク』ではUnreal Engine 4に実装されているオーディオボリューム機能を元に、サウンドチームの使いやすい形で独自に拡張した特製のオーディオボリュームを使用(『FF7 リメイク』全体はUnreal Engine 4で制作されている)。これにより、例えばドアの開閉状態による音の聞こえ方の違いを動的に変化させることができる。
オーディオボリュームは同一の位置で重なることもあるため、配置だけでなく優先度の制御やグルーピング作業なども含め、配置作業はかなり大変だったという。
ZeroOne前提のバスエフェクト構成
続いて、空間表現で非常に重要なバスエフェクト構成について解説された。『FF7 リメイク』では開発当初からZeroOneで活用することを前提してバスの設計を行っていたという。
エフェクトバスは3基のエフェクトから構成されており、主に初期反射から後期残響へと繋がる“リアルな空間表現”のためのエフェクトと、ディレイ反射から後期残響へと繋がる、“響きの誇張表現”のためのエフェクトの2つがある。この2つを組み合わせることで、空間の音の変化を実現している。
距離のZeroOne化
セッションでは続けてガードスコーピオンとのバトルシーンを例に挙げ、敵との距離の遠近によって音のバランスを変更することで音の空間表現を実現していることを解説した。
『FF7 リメイク』のサウンド制作チームが陥った「泥沼」とは?
長年のサウンドドライバ開発で培った表現力と、『FF7 リメイク』制作中のツール強化によって飛躍的な表現自由度を手にしたサウンドチームだが、それだけでは上手くいかなかった部分もあったという。
動的で飛躍的な表現の自由を手に入れ表現の幅が広がったことで、逆に場に適さない音の鳴りまで生まれるようになってしまったという。特に厄介だったのは、最終的な音の鳴りがサウンドデータだけで決まるものではなく、他の外部要因にも依存するようになったことだ。
昔のような静的なデータであれば気にする必要なかったものが、いつの間にか全く意図しない鳴りになっていたりするため、制作時点の確認だけでは不十分になってしまったのだという。
従来の開発では、このような動的でドラスティックな波形の変化はいわゆる“必殺技”であり、数限られたシーンで使うものだったが、これを全体に広げたことでいつの間にか鳴りがおかしくなっているという報告が多数発生、原因解明と再調整で泥沼にはまってしまったという。
そこで得た教訓は「必ず制作時点で可視化までしておく」ということ。インタラクティブサウンドの開発では、くり返しの確認調整は避けられないため、後で調整することを制作時点から考えて可視化しておくことが非常に大事であるとした。
そしてその可視化のために使われたのが、「ImGUI」というグラフィックインターフェイス。ImGUIにより「なぜこんな音の鳴りになっているのか」「なぜこのZeroOneはこの値なのか」など、原因となる要素をその場でたどりながら、ときにはその要素自体もさらに即UI化しながら、デザイナーと問題認識を共有しつつ調整していったという。
また、ImGUIに加えてSEAD専用のリアルタイムデバッガFabre(ファーブル)も使用。こちらは全体的なサウンドドライバの状態を確認することに役立ったという。
これからのインタラクティブサウンドは「量産されていくもの」
谷山氏は「サウンドのインタラクティブな表現の価値が認められ、それを汎化・量産したのが『FF7 リメイク』だったように思います」と振り返る。
その背景として、『FF7 リメイク』の制作時期がこうした新たなサウンド技術が幅広く認知された時期と重なり文化的にも需要があったこと、サウンドドライバのインタラクティブな機能の整備が着実に進んでいたこと、Unreal Engineの日々更新される開発性能に乗れたことを挙げた。
そしてインタラクティブサウンドは最後まで調整しきることが非常に重要であり、それゆえに泥沼的な開発になりがちなため、バックアップ体制や事前準備が必要だとした。
最後は「今後インタラクティブサウンドは“量産していくもの”であるという覚悟を始めから持ち、オーサリングツールの改善、デバッグツールの改善、継続的にエラー検出できるような環境づくりに力を入れていきたい。我々の戦いはまだまだ続きます」と締めくくり、セッションは終了となった。
【この記事を面白い!と思った方へ】
電ファミニコゲーマーでは独立に伴い、読者様からのご支援を募集しております。もしこの記事を気に入っていただき、「お金を払ってもいい」と思われましたら、ご支援いただけますと幸いです。ファンクラブ(世界征服大作戦)には興味がないけど、電ファミを応援したい(記事をもっと作ってほしい)と思っている方もぜひ。
頂いた支援金は電ファミの運営のために使用させていただきます。※クレジットカード / 銀行口座に対応
※クレジットカードにのみ対応