デジタリストニュース
 デジタリストニュース

人気画像生成AI「Stable Diffusion」がメジャーアップデート、高解像度化と社会の問題懸念払拭へ

新着ニュース30件






























人気画像生成AI「Stable Diffusion」がメジャーアップデート、高解像度化と社会の問題懸念払拭へ

このエントリーをはてなブックマークに追加
▼ ニュースのポイント
①Stability AIが「Stable Diffusion 2.0」をリリースした。
②テキストからの生成画像品質が大幅に向上、画像解像度を4倍に高めるモデルや奥行きを維持する深度画像拡散モデルも搭載する。
③健全な創造性開放への寄与を高め、AIポルノなどの不当生成を困難にし、懸念される問題にも対応したとする。

人気画像生成AI、待望のメジャーアップデート
 Stability AIは現地時間の24日、提供する画像生成AIの最新メジャーアップデート版「Stable Diffusion 2.0」をリリースしたことを発表した。ソフトウェア開発プラットフォーム「GitHub」を通じ、一般公開されている。

StableDiffusion


 CompVisによって開発されたオリジナルの初代「Stable Diffusion」は、オープンソースのAIモデルにおける革新的存在となり、世界で誕生するその後の何百ものモデルや、多数のイノベーションに影響を与えてきた。わずか2カ月足らずで33Kスターを獲得し、GitHubの10Kスターに最も速く到達したソフトウェアのひとつになったことも、その支持の高さと影響の大きさを示している。

 今回、リリースした「Stable Diffusion 2.0」では、初代に多くの改善点が加えられ、新たな機能も複数追加搭載された。

 まず「Stable Diffusion」は、自然なテキストプロンプトから画像を生成できるソフトだが、最新バージョンは、新たに開発されたテキストエンコーダー(OpenCLIP)を用いて学習させたText-to-Imageモデルを含んでおり、生成画像の品質を大幅に向上させることに成功している。

 この最新版に含まれるテキスト画像生成モデルは、512×512ピクセルと、768×768ピクセルの両デフォルト解像度で画像を生成できるようになった。

StableDiffusion


より美しく便利に、懸念される問題にも対応
 「Stable Diffusion 2.0」には、画像の解像度を4倍に高める超解像アップスケーラー拡散モデルも搭載されている。これにより、テキストから画像への変換モデルと組み合わせれば、単純なテキストプロンプトから、よりリアルで解像度の高い画像、2048×2048ピクセル、またはそれ以上の解像度で描出した高解像度画像を生成・取得することができる。

 また、「Depth2img」と呼ばれる新たな深度誘導型安定拡散モデルにより、初代の画像間拡散機能を拡張、奥行きある仕上がりでクリエイティブに新たな可能性をもたらすものともしている。

 「Depth2img」は、入力画像の奥行きを推測し、テキストと奥行き情報の両方を用いて新たな画像を生成、オリジナルとは全く異なる画像でありながら、その画像の一貫性と自然な奥行きを維持した変換を実現し、構造保存型の画像間合成や、形状条件付きの画像合成にも活用できるなど、多様な創造的アプリケーションを提供できるようになっている。

StableDiffusion


 さらに、新しいテキストガイド型インペイントモデルを含むものともなった。これは生成画像に適切な微調整を施すもので、画像の一部をインテリジェントかつ迅速に切り替え変更するといったことがごく簡単にできる仕組みを実現している。

 こうした強力な新機能を付加するとともに、昨今広がる社会的な懸念点にも対応した。開発チームの作成したデータセット学習とフィルターにより、成人向けコンテンツを除去、AIによる不適切なポルノ生成を困難にしているという。

 なお、こうした多くの点における改善・変更が加えられたが、シングルGPUでの動作に最適化した仕様であるという特徴は最新版でも維持された。Stability AIでは、この特徴により、保有するリソースの水準を問わず、アクセスできるものとすること、何百万人もの才能ある人々の膨大な潜在能力を活かせるようなものとすることを目指したとしている。

 加えて同社はこのリリースに続き、同モデルを数日以内に自社のAPIプラットフォームや画像生成サービスの「DreamStudio」にも適用させ、リリースすることもアナウンスした。

(画像はプレスリリースより)


外部リンク

Stability AI プレスリリース
https://stability.ai/blog/

▼会社概要
Stability AIは、世界初のコミュニティ主導型オープンソースAIツールを開発・提供することを謳うテクノロジースタートアップ企業。画像、言語、音声、映像、3Dなど多岐にわたる領域の最先端オープンAIモデル開発を推進する。大学研究者らと共同開発した画像生成AI「Stable Diffusion」によってにわかに注目を集める存在となった。Webデザイン界に革命を起こすと指摘する声もあり、まとまった資金調達を成功させてきている。

社名:Stability AI, Inc.
CEO:Emad Mostaque
所在地:英国・Notting Hill, London

Amazon.co.jp : StableDiffusion に関連する商品
  • ネルプがAI人物画像生成ソフト「Zoe」を活用した法人向けサービスを提供開始 生成したAI人物画像を広告コンテンツに活用できる(7月1日)
  • パナソニックが自動計量IH炊飯器「SR-AX1」を発売、独自の計量技術やIoT技術で全自動化(6月30日)
  • XAION DATAが「AUTOHUNT」に新機能を追加 ChatGPTを活用した3つの機能を実装(6月30日)
  • コチラエが「KOCHILAE」をリリース ショッピングセンターや商店街などでの買い回りを支援するクーポン発行プラットフォーム(6月30日)
  • エルイズビーが現場写真共有アプリ「タグショット/タグアルバム」をリリース 撮るだけでタグが付きクラウド上に自動で保存・分類・共有(6月30日)
  • Yahoo!ブックマーク  Googleブックマーク  はてなブックマーク  POOKMARKに登録  livedoorClip  del.icio.us  newsing  FC2  Technorati  ニフティクリップ  iza  Choix  Flog  Buzzurl  Twitter  GoogleBuzz
    -->
    記事検索
    アクセスランキング トップ10










    特集
    お問い合わせ