3Dモデル生成AI
3D MODELS AI
3Dモデル生成AIって何?
実用化レベルや注目のAIモデルを紹介
「ゲーム内の小物や背景を低コストで時間をかけずに作成した」
「プレゼンで使う3Dイメージを内製化した」
そんな気軽な3Dモデル作成が実現しています。本記事では、CG制作を効率化できる3Dモデル生成AIについて解説します。AIによる3Dモデル作成の仕組みや導入時の注意点、おすすめのツールなど、基礎的な知識の習得とツールの選定に役立ててみてください。
3Dモデル生成AIとは?
画像生成AIの『DALL-E 2』、テキスト生成AIの『ChatGPT』など、クリエイティブな仕事を効率化するAIが普及し始めています。
そんな中、2023年に入って注目されたのが、3Dモデルを生成してくれるAIツールです。画像やテキストを読み込ませるだけで、自動でCGオブジェクトが生成されるため、映像業界やゲーム業界を始め、商品イメージを3D化したい企業や建築・家具業界など多様な業種・職種から注目を集めています。
通常の3Dモデル作成の手順
3Dモデルの作成には通常、下記の手順を要します。
-
三面図への展開
-
「三面図」とは、対象物を前、横、後ろの3面から描いたものです。一般的に、キャラクターや形状が複雑なものを3Dモデル化する際は三面図を用意します。
-
モデリング
-
三面図を使って、3Dモデルの形状データを作成する作業です。
-
色やテクスチャ
の設定 -
3Dモデルにカラーマップで色を与えたり、テクスチャマッピングで質感を付与します。
-
リギングと
レンダリング -
キャラクターを動かす場合は、3Dモデルに骨組みと動く仕組みを入れる「リギング」を行い、その後静止画や動画に書き出す「レンダリング」で作業を終えます。
以上のように、通常は多くの工程と時間をかけて作成される3Dモデルが、AIの登場で大幅に効率化することが期待されています。
3Dモデル生成AIに使われている技術
3Dモデル生成AIは複数の技術を組み合わせて作られており、新しい技術を取り入れながら常に進化を続けています。本章では、3Dモデル生成AIに利用されている技術の一部を紹介します。
1
NeRF
『NeRF』は、ディープラーニングを活用した画像生成技術で、ひとつの物をさまざまな角度から撮影し、画像を学習することで、物体の立体像を予測・構築するAIモデルです。光の反射や陰影など、ライティングの影響を反映させる点が画期的で、現実に近いリアルな3Dが作成できると言われています。
今後は、動画生成技術と組み合わせることで、スポーツやライブなどでの活用が期待できるでしょう。
2
Diffusion Model
『Diffusion Model』は「拡散モデル」と呼ばれる仕組みのAIモデルです。オリジナルの画像に少しずつノイズを加え、ノイズを取り除くことで、復元プロセスをモデル化し、取り除いたノイズから画像を生成します。
拡散モデルは3Dに限らず画像生成AIに活用されている基本的な仕組みで、前述したNeRFと組み合わせることで、2次元の画像データから高精度な3D画像を生成できます。
導入にあたっての留意点
現時点での3Dモデル生成AIは実用性が低いと言われていますが、シンプルな形状であれば高精度な3Dモデルが出せるツールや、手作業による調整でクオリティを担保できるツールも登場しています。使い分けと工夫次第では実務で活用できるケースもあるでしょう。
現時点でのクオリティのばらつきを考えると、ゲームの背景用小物など、ディテールにこだわらないオブジェクトの作成に向いています。
また、長い生成時間が必要になるため、画像やイラスト生成系のAIと比べると、リソース面でのメリットは得にくいでしょう。目的に合ったツールを選択するためにも、さまざまなツールを触ってみて、仕上がりや操作感を確認してみることをおすすめします。
3Dモデル生成AI
本章では、人気の3Dモデル生成AIや今後リリースされる予定の3Dモデル生成AIを紹介します。
内 容 | ||
---|---|---|
1 | DreamFusion | Google ResearchとUC Berkeleyの研究チームが発表した3Dモデル生成AI。事前学習した拡散モデルを活用し、テキストを入力するだけで高精度な3Dオブジェクトが生成できる、 text-to-3D(テキストから3Dが作れる)のAIモデルです。 |
2 | Poly | 『Poly』は文章から3Dを生成するtext-to-3DのAIモデルです。生成されたオブジェクトはユーザーが自由に編集可能、出力する際は既存のソフトと連携できるため、実用性の高さが魅力です。 |
3 | Point-E | OpenAIが提供する『Point-E』は、画像から多数の点を集めて3Dオブジェクトを生成します。オブジェクトの精度は他のツールに劣るものの、およそ1〜2分で生成できるというスピード感が特徴です。ディテールを重視しない、背景小物などの作成に向くでしょう。 |
4 | Shap-E | OpenAIが提供する『Shap-E』は、テキストのみならず画像からの3Dモデル生成が可能です。プロンプトを入力してから数十秒程度とスピーディーな生成を実現。複数の写真を使って物体を生成するNeRFが導入されているため、より複雑な形のオブジェクトにも対応します。 ※リンク先はデモサイトです。 |
5 | Imagine 3D | 『Luma AI』が提供する、 text-to-3DのWebサービスです。現在はα版が公開されており、今後のリリースにあたってはその生成時間に注目されています。 |
6 | Magic3D | 『Magic3D』は、NVIDIA社が提供するtext-to-3DのAI生成ツールです。プロンプトの入力により高品質な3Dモデルが生成でき、同様の機能を持つ、Google Researchの『DreamFusion』と比較して約8倍の解像度と、約1/2の生成時間を実現しています。 |
7 | GET3D | 『GET3D』はNVIDIAが開発した3Dモデル生成AIです。画像1枚で人物や建物などのオブジェクトが簡単に生成でき、1つのGPU(画像処理装置)で1秒間に約2個のオブジェクトが生成できます。 |
8 | Luma AI | 『Luma AI』は、スマートフォンで撮影した動画から3Dモデルを生成できる3Dモデル生成AIです。NeRFの導入により、高精度なモデルを生成できるほか、同名のWEBサービスも展開。アップロードした画像ファイルからの生成も可能です。 |
【まとめ】3Dモデル生成AIの今後の展開は?
3Dモデル生成AIは画像生成AIに比べて実用性にばらつきがあると言われており、プロの現場での普及はまだ 先になりそうです。しかし、3Dモデル生成AIの登場によって、専門的な技術がなくても楽しみながら3Dに触れられるようになったことは、長い目で見て今後のクリエイティブ業界の発展につながるでしょう。
こうしたツールは今後、生成物のクオリティ面が進化していくことはもちろん、新たな活用法への期待も高まります。たとえば、3Dプリンターとの連携で、プロダクトデザインから生産のプロセスがより早く、簡単になることが予想されています。一方で、違法な武器の生成が懸念されたり、学習データの著作権問題が整備されていなかったりと、さまざまな課題への議論も必要です。