ダウンコード編集長がお届けするコラム【AI Daily】へようこそ!ここでは、人工知能の分野における最新のニュースと技術進歩を毎日収集しています。これにより、AI 業界の最新の発展を素早く理解し、技術トレンドを洞察し、革新的なアプリケーションを発見できるようになります。私たちは開発者に焦点を当て、AI開発の最前線に追いつき、技術レベルの向上を支援します。今日の AI ニュースでは、AI 音声クローン事件、AI ショート フィルム作成ツール、AI 画像生成サービス、OpenAI などの企業の最新開発について取り上げます。エキサイティングな内容をお見逃しなく。
クリックして最新の AI 製品についてご覧ください: https://top.aibase.com/
1. AI Audio Company、「Three Sheep Recording Gate」の音声はクローン事件であることを確認
深セン瑞宇科技有限公司は、安全管理を強化するために独自に開発したAIダビング大型モデルプラットフォームを使用して、音声が容疑者によってクローン化されたことを確認した。警察は噂を広めるために音声を偽造した容疑者を逮捕し、この事件はさらに捜査中である。
【AiBaseフィード:】
深セン瑞宇科技有限公司は、音声が容疑者によって独自に開発されたAIダビング大型モデルプラットフォームを使用してクローン化されたものであることを確認し、安全管理を強化した。
?♂️ 警察は、噂を広めるために音声を偽造したワン容疑者を逮捕し、刑事強制措置を講じており、事件はさらに捜査されている。
? 同社は、ユーザー ID 認証と音声生成のセキュリティ管理を強化し、テクノロジーの合法的かつ準拠した適用を確保するための内部監査メカニズムを立ち上げました。
2. Meitu の AI ショート フィルム作成ツール MOKI は完全にオープンであり、サウンドトラックの生成と詳細の変更をサポートしています。
Meitu は、自社が開発した AI 短編映画作成ツール MOKI がすべてのユーザーに正式に公開され、AI 主導のスクリプティング、ストーリーボード、ビデオ生成、吹き替え、サウンドトラック機能と組み合わせたワンストップの映画制作機能をユーザーに提供すると発表しました。一般ユーザーでも簡単に始めて、パーソナライズされたショート フィルムをすぐに作成できます。 MOKI は中国語の意味理解の正確さと東洋的なビジュアルスタイルで優れた性能を発揮しており、将来的にはより専門的な機能を提供する予定です。
【AiBaseフィード:】
MOKIはAIショートフィルムの制作を中心に、短編アニメーション、オンライン短編劇、ストーリー絵本、MVなど様々な映像コンテンツ制作を提供しています。
MOKIは操作が簡単で、設定段階、コンテンツ作成段階、ポストプロダクション段階のわずか3ステップでクリエイティブなショートフィルムを作成できます。
? MOKI は、サウンドトラック付きのビデオ コンテンツのワンクリック生成をサポートしていますが、現行世代の効果を改善する必要がありますが、製品力はさらに強化されました。
3. Magnific、4K画像を直接生成できるV2画像生成サービスを開始
Magnific が最近開始した V2 画像生成サービスは、AI 画像処理の分野に新たな波を引き起こし、ハイエンド ソフトウェアからトップレベルの AI 画像生成器への飛躍を示し、技術革新とユーザー エクスペリエンスの最適化に対する同社の野心を示しています。 。
【AiBaseフィード:】
✨ 4K 画像の直接生成: V2 バージョンでは 4K 品質の画像を直接生成できるため、効率が向上し、クリエイターの創作空間が広がります。
多様なスタイル オプション: ユーザーは説明プロンプトを入力し、解像度とスタイルを選択するだけで、システムが最適化された画像を生成し、豊かなクリエイティブの可能性を提供します。
微調整と高度な機能: クリエイティブなディテールの生成、背景の調整、再照明などの微調整ツールを提供し、プロフェッショナル ユーザーのニーズを満たすことができます。
詳細リンク:https://top.aibase.com/tool/magnific-ai
4. OpenAI の新しいモデル o1 はバイアスを「完全に」修正できると主張していますが、データはそれを完全に裏付けていません。
最近、OpenAI のグローバル問題担当副社長であるアンナ・マカンジュ氏は、国連の「フューチャー・サミット」で人工知能の偏見についての見解を表明しました。彼女は、o1 モデルは AI システムのバイアスを大幅に軽減できるが、実際のテスト結果は期待したほど良くなかったと述べました。
【AiBaseフィード:】
o1 モデルは AI のバイアスを大幅に軽減するといわれていますが、テスト結果では期待ほどのパフォーマンスが得られないことが示されています。
o1 は、暗黙的な識別では GPT-4o よりも優れたパフォーマンスを発揮しますが、明示的な識別では劣ります。
? 推論モデル o1 はコストが高く、動作が遅いため、今後も多くの点で改善する必要があります。
5. Google NotebookLMの新機能:YouTubeコンテンツのエッセンスを素早く要約
Google NotebookLMは、ビデオトランスクリプトを分析して重要な情報を抽出する新機能を開始し、ユーザーはYouTubeビデオのエッセンスを簡単に取得し、学習効率を向上させることができます。ユーザーはトピックをクリックして詳細情報を取得したり、質問したり提案を取得したり、トランスクリプトの検索や学習ガイドの作成に役立つ音声録音機能をサポートしたりできます。

【AiBaseフィード:】
Wenxin Big Model 4.0 の 1 日あたりの平均通話量は 7 億回以上で、13 倍以上増加しています。
Baidu は、ユーザー エクスペリエンスを向上させるために、ツール バージョンとターボ バージョンを連続的にリリースしてきました。
Baige AI ヘテロジニアス コンピューティング プラットフォーム 4.0 と Qianfan 大規模モデル プラットフォーム 3.0 のアップグレードにより、企業は大規模モデルをより効率的に使用できるようになります。
11. OpenAI の新しいマルチモーダル コンテンツ レビュー モデルはオンラインです。GPT-4o に基づいて、テキストと画像を検出できます。
デジタル時代では、コンテンツのセキュリティ問題がますます重要視されています。OpenAI は、最新の GPT-4o テクノロジーに基づいて、有害なテキストや画像を正確に識別できる、「omni-moderation-latest」と呼ばれるマルチモーダル コンテンツ レビュー モデルを開始しました。このアップデートは、開発者に、より強力なレビュー システムを構築するための強力なツールを提供します。新しいモデルは、テキストと画像入力のモデレーションをサポートしており、英語以外のコンテンツを処理するときに特に優れたパフォーマンスを発揮し、精度と検出機能を向上させて、ユーザーがより安全な空間で通信できるようにします。
【AiBaseフィード:】
? 新しいモデルは GPT-4o テクノロジーに基づいており、テキストと画像のマルチモーダル レビューをサポートします。
? 40 言語、特にリソースの少ない言語で検出精度が 42% 向上しました。
? 違法で暴力的なコンテンツを識別する機能を向上させるために、2 つの新しいタイプのテキスト レビューを追加しました。
詳細リンク: https://openai.com/index/upgrading-the-moderation-api-with-our-new-multimodal-moderation-model/
12. Maoyan Entertainment、ダイナミック絵コンテAI生成ツール「Magic Brush Ma Liang」をリリース
Maoyan Entertainment が発売した「Magic Pen Ma Liang」ツールは、脚本作成者に大きな利便性をもたらし、インテリジェントな分析、キャラクター作成、絵コンテ作成などの機能を実現し、作成者の時間と労力を節約します。このツールは、脚本のコンテンツを音声視覚的に提示することもできるため、クリエイターが作品のパフォーマンスを向上させ、映画やテレビ業界のイノベーションを促進するのに役立ちます。
【AiBaseフィード:】
?ダイナミックストーリーボードAI生成ツール「Ma Liang」は、長いスクリプトを分析するために特別に設計されています。
脚本のインテリジェントな分析、キャラクター作成、絵コンテ作成、セリフ読みなどの機能を実現します。
? クリエイターが作品のパフォーマンスを向上させ、映画やテレビ業界のイノベーションを促進できるよう、脚本のコンテンツを音声で視覚的に提示します。
今日のAI Dailyをお読みいただきありがとうございます!この情報がお役に立てば幸いです。 これからも Downcodes の編集者にご注目ください。今後も人工知能の分野でさらにエキサイティングなコンテンツをお届けしていきます。