290: 名無し 2024/05/14(火) 02:28:43.41 ID:9GGuLAQl
Hello GPT-4o
https://openai.com/index/hello-gpt-4o/
ChatGPTを2倍高速に 米OpenAI、ヒトの反応速度で会話
https://www.nikkei.com/article/DGXZQOGN13D7F0T10C24A5000000/
https://openai.com/index/hello-gpt-4o/
ChatGPTを2倍高速に 米OpenAI、ヒトの反応速度で会話
https://www.nikkei.com/article/DGXZQOGN13D7F0T10C24A5000000/
1: 名無し 2024/05/14(火) 02:32:37.12 ID:GgaRhT5s0
音声の実装(Text-To-Speech)
・応対スピードの向上
・感情表現の実装(感情こもりすぎ)
・歌唱の実装(歌も歌える)
・対話の空白を埋める相槌の実装
③資格の実装(Vision)
・動画をリアルタイムでみて即座に理解し音声で回答
・動画を見ながら数学を解く手伝いまで
④プログラムの実装支援
・コピペしてシームレスにコードの共有から
コーディング補助(音声対応)
・自分のデスクトップをリアルタイムで共有して
見せながら説明(Visionの延長と思われる)
(一緒に線形代数方程式を読解)
⑤リアルタイム翻訳(ついに来た)
・英語、イタリア語など。
入ってきた言葉に応じて臨機応変に。
もう、翻訳こんにゃく。
⑥人物理解
・ビデオ通話のリアルタイムの会話相手。
人物のリアルタイムのビデオを見て、
会話が成立している。
どんなスタイルか等相談相手にすら。
・応対スピードの向上
・感情表現の実装(感情こもりすぎ)
・歌唱の実装(歌も歌える)
・対話の空白を埋める相槌の実装
③資格の実装(Vision)
・動画をリアルタイムでみて即座に理解し音声で回答
・動画を見ながら数学を解く手伝いまで
④プログラムの実装支援
・コピペしてシームレスにコードの共有から
コーディング補助(音声対応)
・自分のデスクトップをリアルタイムで共有して
見せながら説明(Visionの延長と思われる)
(一緒に線形代数方程式を読解)
⑤リアルタイム翻訳(ついに来た)
・英語、イタリア語など。
入ってきた言葉に応じて臨機応変に。
もう、翻訳こんにゃく。
⑥人物理解
・ビデオ通話のリアルタイムの会話相手。
人物のリアルタイムのビデオを見て、
会話が成立している。
どんなスタイルか等相談相手にすら。
286: 名無し 2024/05/14(火) 02:26:28.92 ID:9GGuLAQl
GPT-4o
これはすごいな
とりあえず、デモは前の批判されたGeminiのPV以上の事をリアルにやっていた
これはすごいな
とりあえず、デモは前の批判されたGeminiのPV以上の事をリアルにやっていた
310: 名無し 2024/05/14(火) 02:50:34.01 ID:IRsa3lWS0
ワイより有能や😲
287: 名無し 2024/05/14(火) 02:26:54.21 ID:rr46GkvS
凄いけど、いわゆるAI好きが求めているのとは方向性が違うな
まあLLMとして凄くなってるならそれで良いけど
まあLLMとして凄くなってるならそれで良いけど
288: 名無し 2024/05/14(火) 02:27:44.95 ID:rr46GkvS
これ通信量が大変な事になると思うんだけど耐えられるのか?
未だにテキストすらまともに書き出せてないのに
未だにテキストすらまともに書き出せてないのに
283: 名無し 2024/05/14(火) 02:09:26.63 ID:rr46GkvS
292: 名無し 2024/05/14(火) 02:32:15.85 ID:8nIDQC5m
高性能なチャットアプリが作れるようになるのは良いな
声色も変えられるといいけど
声色も変えられるといいけど
294: 名無し 2024/05/14(火) 02:35:41.40 ID:IDTw0xjJ
> GPT-4o (「オムニ」の「o」) は、人間とコンピューターのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。音声入力にはわずか 232 ミリ秒で応答でき、平均では 320 ミリ秒で、人間の応答時間とほぼ同じです。(新しいウィンドウで開きます)会話の中で。英語のテキストおよびコードでは GPT-4 Turbo のパフォーマンスに匹敵し、英語以外の言語のテキストでは大幅に改善されており、API でははるかに高速で 50% 安価です。 GPT-4o は、既存のモデルと比較して、特に視覚と音声の理解に優れています。
296: 名無し 2024/05/14(火) 02:37:10.50 ID:IDTw0xjJ
> GPT-4o より前は、音声モードを使用して、平均 2.8 秒 (GPT-3.5) および 5.4 秒 (GPT-4) の遅延で ChatGPT と会話できました。これを実現するために、音声モードは 3 つの個別のモデルのパイプラインです。
(中略)
GPT-4o では、テキスト、ビジョン、オーディオにわたって単一の新しいモデルをエンドツーエンドでトレーニングしました。これは、すべての入力と出力が同じニューラル ネットワークによって処理されることを意味します。 GPT-4o はこれらすべてのモダリティを組み合わせた最初のモデルであるため、このモデルで何ができるか、そしてその制限についてはまだ表面をなぞっただけです。
(中略)
GPT-4o では、テキスト、ビジョン、オーディオにわたって単一の新しいモデルをエンドツーエンドでトレーニングしました。これは、すべての入力と出力が同じニューラル ネットワークによって処理されることを意味します。 GPT-4o はこれらすべてのモダリティを組み合わせた最初のモデルであるため、このモデルで何ができるか、そしてその制限についてはまだ表面をなぞっただけです。
304: 名無し 2024/05/14(火) 02:45:24.27 ID:IDTw0xjJ
>>296
「全ての入出力が同じNNで処理される」
これで、ネイティブなマルチモーダルであるGeminiに追いついたか
「全ての入出力が同じNNで処理される」
これで、ネイティブなマルチモーダルであるGeminiに追いついたか
297: 名無し 2024/05/14(火) 02:39:21.48 ID:mHtNsj7Z
フリーですべできるんなら、またテレビで面白がられるな
それで認知度が高まるなら良いか
それで認知度が高まるなら良いか
300: 名無し 2024/05/14(火) 02:41:22.02 ID:rr46GkvS
狙ってるんだろうけど、AI使って儲ける方法が思いつかない方向の進化だな
302: 名無し 2024/05/14(火) 02:42:50.11 ID:dft/hYNE
さあ明日のGoogle ioが楽しみだ
305: 名無し 2024/05/14(火) 02:46:36.34 ID:IDTw0xjJ
OpenAI「お前ら、これを超えて来いよ?」というGoogleへのプレッシャーかも
306: 名無し 2024/05/14(火) 02:47:07.81 ID:rr46GkvS
改めてgeminiの嘘動画見直したけど、既に上回ってるな
明日のGoogleどうなるんだ
明日のGoogleどうなるんだ
314: 名無し 2024/05/14(火) 03:06:54.42 ID:RI7TR/QZ
これが今の限界だとしたらGPT5はまだまだ先かな
316: 名無し 2024/05/14(火) 03:09:12.24 ID:6JChTKDU
デモに出てたデスクトップアプリ版はmacOSから出るみたい。Windows版は今年の後半に出る予定とのこと
Mac持ってないから買うか
Mac持ってないから買うか
322: 名無し 2024/05/14(火) 03:27:05.98 ID:uvsegrfj
デモ動画でiPhone使ってるし、iPhoneにこれが導入されるのか?
iPhoneで無料版と有料版もあるなら、OpenAIは儲かりそうだな
iPhoneで無料版と有料版もあるなら、OpenAIは儲かりそうだな
325: 名無し 2024/05/14(火) 03:35:57.84 ID:e/1fyd40
326: 名無し 2024/05/14(火) 03:45:24.38 ID:OicsKnW5
驚いた
内容も生成スピードも段違い
n回試行後のサイコロの出目和xの確率質量関数f_n(x)を、生成関数を用いて一般のnの場合について解析的に求める手順を示してください。
GPT-4o
https://chatgpt.com/share/69c2e930-ea66-4600-a39e-537283640bab
GPT-4 Turbo
https://chatgpt.com/share/4de82953-d401-48c2-b84c-f151f2b89129
内容も生成スピードも段違い
n回試行後のサイコロの出目和xの確率質量関数f_n(x)を、生成関数を用いて一般のnの場合について解析的に求める手順を示してください。
GPT-4o
https://chatgpt.com/share/69c2e930-ea66-4600-a39e-537283640bab
GPT-4 Turbo
https://chatgpt.com/share/4de82953-d401-48c2-b84c-f151f2b89129
327: 名無し 2024/05/14(火) 03:52:00.93 ID:rr46GkvS
むっちゃ速いし、Opusより良い気がしないでもないな
342: 名無し 2024/05/14(火) 07:12:43.54 ID:q7+ACS1a
こんな発表されてGoogleどうなってしまうん?
328: 名無し 2024/05/14(火) 03:57:01.24 ID:/nc7l4SJ
347: 名無し 2024/05/14(火) 07:48:43.01 ID:ErqNQTZn
>>328
"AI, Search and more"
Googleはモデル、細かい機能、検索関連、いろいろ隠し玉がありそう
"AI, Search and more"
Googleはモデル、細かい機能、検索関連、いろいろ隠し玉がありそう
コメント
コメント一覧 (5)
ideal2ch
が
しました
Apple端末の公開も早くなる
ideal2ch
が
しました
ideal2ch
が
しました
ideal2ch
が
しました
AI が実用的になった時代には注目されないだろうけど。
ideal2ch
が
しました
コメントする