Быстрое развитие генеративного искусственного интеллекта, особенно серии моделей GPT, открыло новые возможности во многих областях. GPT-4 продемонстрировал свои мощные возможности: от значительного улучшения результатов экзаменов на адвоката до применения в сфере бизнеса. Однако некоторые отраслевые эксперты ставят под сомнение способность к пониманию и надежность нынешнего генеративного ИИ, полагая, что его способности к рассуждению и пониманию мира все еще недостаточны, а будущее развитие по-прежнему сталкивается со многими проблемами. Редактор Downcodes поможет вам глубже изучить будущее направление развития генеративного ИИ, а также возможности и проблемы, с которыми сталкивается отечественная индустрия генеративного ИИ.
Каково будущее направление развития генеративного искусственного интеллекта?
Нельзя отрицать, что нынешний GPT-4 значительно улучшен по многим возможностям. По сравнению с GPT-3.5, производительность GPT-4 в сложных профессиональных областях значительно улучшилась, а его способность к логическому рассуждению также выше. На квалификационном экзамене на адвоката в США балл GPT-4 может достигать 10% лучших, но GPT-4. 3.5 может достичь только нижних 10%.

Источник изображения: Открытый AI
Существенное улучшение возможностей также позволяет Chat GPT открыть больше сценариев использования. В настоящее время Open AI официально предоставляет несколько основных сценариев применения, таких как добавление ИИ в Duolingo для ежедневного общения с пользователями для ускорения изучения языка пользователями; Morgan Stanley использует GPT-4 для управления своей базой знаний, чтобы помочь сотрудникам быстро получить доступ к информации. контент, который вы хотите.
Однако многие громкие имена сомневаются в текущих возможностях GPT. Стюарт Рассел отметил в своем выступлении, что Chat GPT и GPT-4 не понимают мир и не «отвечают» на вопросы. Текущая модель большого языка — это всего лишь часть головоломки. Чего в настоящее время не хватает в этой головоломке. в конечном итоге это будет выглядеть , это неясно. Многие недостатки в возможностях также определяют, что до разработки общего искусственного интеллекта еще предстоит пройти долгий путь. Из-за различных сомнений в возможностях GPT-4 Стюарт Рассел также модифицировал PPT во время выступления Сэма Альтмана.

Источник изображения: Конференция мудрости
Той же точки зрения, что и Стюарт Рассел, придерживается Ян Ликунь, лауреат Премии Тьюринга, одного из «Большой тройки глубокого обучения», и главный ученый в области искусственного интеллекта в Meta. Он считает, что нынешней авторегрессионной модели GPT не хватает планирования, что приводит к ошибкам. его способность к рассуждению. В настоящее время это невозможно. Если сгенерирована большая языковая модель, основанная на вероятности, практически невозможно решить проблему ошибок. Когда входной текст увеличивается, вероятность ошибок также увеличивается в геометрической прогрессии.
На самом деле, обвинения двух крупных парней в адрес GPT не являются необоснованными. Поскольку алгоритм RLHF, используемый Chat GPT, сам по себе опирается на человеческое восприятие, он позволяет модели оценивать качество собственных ответов и обучаться постепенно давать ответы более высокого качества. Если вы хотите улучшить способность модели рассуждать, вам необходимо дополнить базу данных большим количеством параметров и постоянно повторять алгоритм.

Источник: Southwest Securities.
Однако существование различных рисков также мешает многим компаниям, занимающимся генеративным ИИ, легко попробовать. Если генеративный ИИ сможет достичь тех же способностей к рассуждению историй и созданию эмоций персонажей, что и писатель романов, сделает ли это генеративный ИИ полностью вне контроля человека? Хотя это вызывает глобальную панику, столкнется ли оно также с жестким контролем со стороны местных органов власти, в результате чего предыдущие инвестиции в генеративный искусственный интеллект окажутся напрасными?
Что касается будущего направления развития генеративного искусственного интеллекта, ответ Ян Ликуня — модель мира. Эта модель мира — это не только модель, которая имитирует человеческий мозг на нейронном уровне, но также модель мира, которая полностью соответствует разделам человеческого мозга с точки зрения когнитивных модулей. Самая большая разница между ней и большой языковой моделью заключается в том, что она может это сделать. иметь возможности планирования и прогнозирования (мировая модель) и возможности расчета затрат (модуль затрат).
С помощью модели мира мы можем лучше понимать мир, а также прогнозировать и планировать будущее. С помощью модуля учета затрат в сочетании с простым спросом (будущее должно планироваться в соответствии с логикой, которая позволяет сэкономить наибольшую стоимость действий). это может устранить все потенциальные яды и ненужные последствия.

Источник изображения: Конференция мудрости
Но проблема в том, что параметры, алгоритмы, стоимость и т. д. модели мира во время обучения просто давали некоторые стратегические идеи. Например, использование моделей самоконтроля для обучения и создания моделей многоуровневого мышления и т. д., но Ян Ликунь не смог дать полный план того, как это реализовать.
Остальные участники не поделились своими взглядами на будущее направление развития генеративного ИИ. Поэтому последующий генеративный ИИ по-прежнему будет поддерживать ситуацию, когда каждая компания «занимается своим делом», а глобально унифицированный генеративный ИИ может остаться только на лабораторной стадии.
03. Внутреннее предсказание генеративного ИИ
Профессор Хуан Тецзюнь, президент Научно-исследовательского института Чжиюань, заявил в интервью средствам массовой информации после встречи, что текущая проблема с отечественными большими моделями генеративного ИИ заключается в том, что отрасль перегрета, но данные обучения слишком малы, а десятки миллиардов моделей только появляются. Хотя среди них есть некоторые технические возможности, из-за повторяющихся усилий, в то время как отраслевые ресурсы становятся все более рассредоточенными, все еще существует определенный разрыв между их уровнем интеллекта и крупными зарубежными генеративными моделями ИИ.
Как сказал профессор Хуан Тецзюнь, в качестве примера возьмите большую модель «Tongyi Qianwen», принадлежащую Alibaba, поскольку данные, используемые для обучения этой большой модели, представляют собой большое количество китайских разговоров и разговоров, извлеченных из Taobao, Alipay, Tmall и других отраслей Alibaba. Объем данных предварительного обучения для текстовых данных, а также текстовых данных из некоторых других источников составляет около 200 миллиардов слов, что эквивалентно 14 ТБ текстовых данных.
Объем обучающих данных Chat GPT составляет около 4,5 миллиардов слов, что эквивалентно 300 ГБ текстовых данных. Данные для обучения относительно невелики, поэтому «Tongyi Qianwen» от Alibaba также не имеет мультимодальных возможностей. С точки зрения текста оба сильно отстают от GPT-4.
Согласно данным «Отчета о комплексной оценке возможностей большой языковой модели за 2023 год», опубликованного Исследовательским центром InfoQ, Chat GPT в настоящее время лидирует среди других отечественных производителей крупных моделей с совокупным рейтингом 77,13%.

Источник: «Отчет о комплексной оценке возможностей большой языковой модели за 2023 год».
В то же время профессор Хуан Тецзюнь также отметил, что сегодняшние большие модели являются промежуточным продуктом технологических итераций. С последующим развитием отечественной индустрии больших моделей разумное количество крупных модельных экосистем, которые могут выжить в будущем, составляет около трех. .
Как сказал профессор Хуан Теджун, Ма Хуатенг отметил на встрече высокого уровня в Tencent, что дивиденды от рынка C-конца исчезнут в ближайшие десять лет. Вся надежда лежит на рынке ToB-конца, причем во второй половине года. Интернета принадлежит промышленному Интернету. Институт бизнес-исследований Али ранее отмечал, что следующие десять лет станут прекрасной возможностью для трансформации традиционных предприятий.
Однако с точки зрения рынка ToB, взяв за основу рынок SaaS, который развивался в течение многих лет, если большая модель хочет по-настоящему открыть рынок ToB, ее суть должна заключаться в том, чтобы привнести ценность «снижения затрат и повышение эффективности» для клиентов, особенно в нынешнюю эпоху неопределенности. Это особенно актуально, когда несколько отраслей все еще остаются в стороне от крупных моделей. Текущие общие проблемы, с которыми сталкиваются малые и средние традиционные обрабатывающие отрасли, в основном основаны на традиционных обрабатывающих отраслях, - это сокращение заказов, отрасль ведет ценовые войны, а циклы сбора платежей на последующих этапах стали более длительными. отрасли в настоящее время изо всех сил пытаются поддержать себя. Чтобы избежать высоких затрат проб и ошибок, многие малые и средние производственные компании, естественно, не решаются легко попробовать использовать большие модели.
И, судя по истории развития отрасли SaaS, отечественная отрасль SaaS вступила в пик роста в 2015 году после 10 лет затишья с начала 2004 года. С момента начала эпидемии в 2020 году эпидемия ускорила цифровую трансформацию предприятий, и внутренний рынок SaaS вступил в критический период роста. Но даже в этом случае текущая отечественная отраслевая экосистема SaaS еще не завершена, а рынок еще не созрел.
Источник изображения: Flash Cloud
Очевидно, что открытие рынка TOB для больших моделей не происходит в одночасье, а представляет собой крайне медленный процесс. Более того, затраты на алгоритмы, вычислительные мощности и данные во время итерации модели, включая последующий запуск различных функций, требуют от крупных модельных компаний постоянного инвестирования больших объемов средств.
Коммерциализация занимает много времени, капитальные вложения высоки, и трудно получить прибыль в краткосрочной перспективе. В будущем у компаний, испытывающих недостаток денежных средств, не будет иного выбора, кроме как закрыть свои собственные крупные модели перед лицом финансового давления. , и отраслевым ресурсам станет еще сложнее сконцентрироваться на производителях моделей с большими головками.
Судя по опыту многих отраслей, таких как онлайн-заказ такси и доставка еды, после многих лет потрясений в развивающейся отрасли только около трех компаний могут действительно развиваться в будущем, а многие другие компании погрузились в историю. длинная река.
В целом, генеративный ИИ находится на стадии быстрого развития, где есть как возможности, так и проблемы. В будущем модели мира могут стать важным направлением развития, однако их реализация по-прежнему сталкивается со многими техническими и коммерческими проблемами. Отечественной индустрии генеративного искусственного интеллекта также необходимо решить такие проблемы, как масштабирование данных и коммерциализация, чтобы выделиться в жесткой конкуренции. Редактор Downcodes продолжит обращать внимание на тенденции в этой области и предлагать читателям еще больше интересного контента.