От первой буквы кода до первого миллиона: реально ли создать нейросеть и на этом заработать
С бурным развитием информационных технологий появляется всё больше новых профессий. Одни связаны с написанием востребованных программных продуктов, вторые – с интернет-маркетингом, третьи – с дизайном, аналитикой данных и не только. Но есть и те, которые предполагают непосредственную работу с нейросетями и искусственным интеллектом – их создание и тренировку.
Всё, что связано с нечеловеческим «разумом», конечно, звучит заманчиво. Но возможно ли в одиночку построить на этом прибыльный бизнес? Своим мнением поделился научный сотрудник института № 8 «Компьютерные науки и прикладная математика» Московского авиационного института, директор департамента цифровой трансформации в компании BetBoom Юрий Чайников.
Что такое нейросеть с ИИ и как её создать?
Понятие «нейросеть» сегодня уже не вызывает таких страха и трепета, как 20 и даже 10 лет назад. Но с течением времени его определение серьёзно трансформировалось, что продиктовано новшествами в деле создания уникальной структуры. Итак, современная нейросеть — это система на базе искусственного интеллекта, которая может анализировать данные и выполнять поставленные задачи, принимая зачастую самостоятельные решения. Базируется нейросеть на так называемой Data Science, или науке о данных, представляющей собой симбиоз математики и статистики, необходимый для обучения нейросети. Принцип прогресса нейросети прост: чем больше данных в неё загружают, тем быстрее она обучается и тем качественнее будет результат её работы с человеком. Конечно, вероятность ошибок существует всегда, но с «взрослением» нейросети их становится всё меньше и меньше.
Что нужно, чтобы создать собственную нейросеть на основе искусственного интеллекта, которая будет хорошо работать? По большому счёту, только сильное желание и компьютер. Если не хватает каких-то знаний — информацию можно с лёгкостью найти в интернете или закрыть пробелы на базовых курсах дополнительного образования. Создать собственную нейросеть — значит, создать программу, которая будет выполнять те задачи, которые заложил в неё её автор, учиться тому, чему захочет научить её создатель. Как заметил Юрий Чайников, этап написания нейросети отнимает не так много времени, как её обучение — по сути, это бесконечный процесс, который требует огромного количества ресурсов. Чтобы хранить данные для обучения — необходимо обеспечить свою подопечную достаточно мощными сервисами. И чем больше будет развиваться нейросеть — тем сложнее и дороже будет её содержать.
— На первый взгляд нейронные сети кажутся чем-то невероятным и сложным для понимания. По сути, это программа, которая умеет обучаться на основе данных и примеров, и по своему устройству напоминает человеческий мозг. Она не работает по готовым правилам и алгоритмам, а пишет их сама во время обучения. Нейросеть разбивает введённый текст на отдельные слова или фразы — токены, стандартные единицы измерения в LLM. Каждый токен представляет собой часть информации. Качество работы нейросети зависит от трёх параметров: от её размеров, объёма обучающей выборки и от объёма вычислительных мощностей, которые мы потратили на то, чтобы её тренировать. И зависимость эта экспоненциальная, то есть чем большее значение величина принимает, тем быстрее растёт, — подчеркнул эксперт МАИ.
А теперь в деньгах...
Юрий Чайников добавил, что топовые нейросети имеют размер в сотни миллиардов параметров. Так, например, если мы будем исходить из того, что аренда одного сервера обходится около одного доллара в час и нам необходимо потратить 50 миллионов часов на тренировку нейросети, чтобы прогнать через неё обучающую выборку больше триллиона слов, то на обучение нейросети мы потратим 50 миллионов долларов вычислительных мощностей. Цифры впечатляют. Ну и вывод напрашивается сам собой: создать нейросеть можно и одному, но вот содержать её, растить и превращать в прибыльный бизнес без помощи и спонсорства — почти нереально.
Есть ли успешные кейсы?
На примере грандиозных планов основателя и генерального директора американской организации, занимающейся, в частности, созданием нейросетей, OpenAI Сэма Альтмена Юрий Чайников рассказал, как крупные компании решают вопрос с содержанием «умных» программ. Эксперт отметил, что OpenAI намеревается построить вычислительные кластеры на триллион долларов и на их снабжение потребуется больше 10% совокупного энергопотребления США. Чтобы обеспечить электроэнергией дата-центры, на которых будут крутиться модели, необходимо построить атомные электростанции с десятками ядерных реакторов, мощностью в десятки гигаватт. Планы, действительно, грандиозные. Но насколько они оправданы?
— В настоящее время себестоимость обработки одного запроса топовой нейросетью от OpenAI обходится по разным оценкам от 20 до 40 центов. Тогда как запрос в поисковике Google — порядка 1 цента. Если Google зарабатывает с каждого запроса примерно 20 центов, то это отличный бизнес. А вот бизнес OpenAI пока не так оптимистично прибылен. Но экспоненциальный рост мощностей может всё изменить, — утверждает Юрий Чайников.
Чтобы помочь американской компании с развитием бизнеса, вложиться решила другая, не менее известная компания Microsoft. Этот опыт доказывает, что в одиночку тянуть большой нейросетевой бизнес будет очень сложно.
Юрий Чайников считает, что заниматься развитием собственной нейросети человеку нужно только в том случае, если он твёрдо уверен в том, что его идея нова и конкурентноспособна. Но учитывая, что в большинство аналогичных проектов вкладываются колоссальные средства, всё же лучше начинать их не с нуля, а брать уже готовую нейросеть и тренировать её, применяя различные технические уловки.
— Начинать бизнес — это всегда риск. Ведение бизнеса одному человеку в сфере искусственного интеллекта — это риск вдвойне, так как эта область деятельности находится в стадии активного развития и может быть непредсказуемой. Подобные стартапы рекомендуется делать вдвоём или втроём, тогда шансы на выживание в разы больше, — подвёл итог эксперт.
Материал подготовлен при поддержке Минобрнауки России