Часть 1. YandexGPT
16 июля 2023 г., 00:00
Примечания:
В силу работы программиста и любви к фанфикам, я не могла пройти мимо такого прорыва!
Приятного прочтения!
В мае 2023 Яндекс выпустили свой ответ нашумевшему ChatGPT — YandexGPT или просто YaGPT и встроили его в Алису. Вы скажете: «Ха, а что Яндекс не мог пооригинальнее название придумать?», а я вам отвечу, что буквы GPT расшифровываются как Generative pre-trained transformer, что переводится как «генеративный предварительно обученный преобразователь», то есть модель, которую заранее натренировали генерировать текст. Я могла бы устроить вам долгий рассказ про перцептроны, видах обучения нейросетей, поговорить про нейронные сети Кохонена и прочее прочее. Но вы вряд ли поняли, что я такое понаписала в предыдущем предложении, особенно если вы гуманитарий. Сидите вы и не понимаете, что вообще происходит, и какого черта так много умных слов на непонятном языке забыло на фикбуке. Автор выпендрилась, поехали дальше.
Если объяснять кратко, как обучают нейронки писать по запросу? Умные разработчики-математики помещают в базу данных большое количество примеров разных текстов, по которым нейросеть и строит ответ на запрос. Сейчас нейросети обучаются с учителем, а кстати, дети ходить учатся без учителя, ибо они все сами делают. Вот так вот, нейросеть за ручку водят их создатели, говорят, что можно, а что нет. К примеру, версия GPT3 2020 года имела 570 ГБ примеров текста! Для осознания объёмов: одна страничка А4 в Word весит около 10-15 Кб. Там же статьей, книг и прочего сотни тысяч!
Сама нейросеть не понимает, что она делает. Для неё вы задали тему, к примеру: «Напиши историю о том, как пельмени поехали на рыбалку». У нейросети есть коробка с конструктором, на каждой деталке написано слово. Она находит детали со словами «пельмени», «поехали», «рыбалка», берёт ключевое слово «история» выкидывает все статьи/анекдоты и прочее ненужное, оставляя только «рассказы», «сказки», «истории», затем смотрит примеры текстов про пельмени, поездку и рыбалку. Далее берёт слова для связки по типу «как-то раз», «было», «однажды», «они» и другие типичные, примитивные для жанра. Соединяет детальки по заданным ей примерам в текст и выдаёт результат. Нейросеть предугадывает продолжение фразы, соединяя детали в нечто. Все же знают про Т9 и его подсказки по словам? Здесь принцип похожий. Нейронке глубоко пофиг, что порой выходят такие несуразные монстры, что читать больно. Главное, что соблюдены правила и общая структура.
Итак, вбиваем наш запрос. Вот что выдал YandexGPT:
«Пельмени-Рыбаки: как поймать удачу на рыбалке.
Однажды пельмени решили отправиться на рыбалку. Они собрали свои удочки и снасти и отправились в путь. Пельмени были очень рады этому приключению и предвкушали хороший улов.
Они нашли тихое и спокойное место на берегу реки и начали ловить рыбу. Но, к их удивлению, у них ничего не получалось. Рыба просто не клевала.
Пельмени попытались изменить свою тактику и сменили место ловли, но и это не помогло. Они продолжали ловить рыбу, но все было безрезультатно.
Наконец, после нескольких часов попыток, пельмени поняли, что им просто не везет. Они решили вернуться домой и заняться другими делами.
Но по дороге они встретили старого рыбака, который рассказал им о том, что нужно использовать приманку, чтобы привлечь рыбу. Пельмени поблагодарили старика и отправились домой, чтобы приготовить новую приманку.
На следующий день они вернулись на то же место и использовали новую приманку. И, к их радости, они поймали много рыбы.
С тех пор пельмени стали настоящими мастерами рыбалки и каждый раз, когда они отправлялись на рыбалку, они всегда брали с собой приманку, которую они научились готовить от старого рыбака».
Нам выдало аж 7 абзацев! Сразу отмечу, что повторов в тексте много, предложения короткие, таких вещей, как «причастные и деепричастные обороты» нет совсем, отсутствуют красные строки. Сколько я не пыталась добиться сложной структуры предложения, у меня не вышло. Главные плюсы: грамотность текста, причём соблюдены правила как орфографии и пунктуации, так и стилистические нормы. Логики текст не лишен. Я читала оригинальные тексты людей на фикбуке гораздо хуже по содержанию и смысловой нагрузке. Вы наверняка видели такие работы. Как правило все рассказы, которые я требовала от нейросети, заканчивались фразой «с тех пор», «в итоге», «после этого случая». Смею предположить, что там какие-то особые алгоритмы написаны, чтобы так было. При этом вы можете прописать, чтобы история не заканчивалась указанными вами фразами или просто попросить переписать конец, не используя такую конструкцию. Можно попросить Яндекс «ответить иначе», и он вам составит совершенно другую историю. При переписывании теряет абзацы и пишет все одним сплошным полотном. Также Яндекс откажет вам в написании даже на каплю неприличного или оскорбляющего текста. Ваш запрос включает в себя такие слова, как «попа», «секс», «война» и подобные? Нейросеть YandexGPT напишет, что не будет вам писать о таком. В данном случае могу предложить заменить Стоп слово на нейтральное, а уже после менять его по всему тексту самостоятельно. Что за дичь у вас получиться страшно предположить.
Какие ещё преимущества? Может подкинуть идею для написания фанфика. Переписать текст и тут, кстати, причастные и деепричастные обороты учитываются. К примеру, я составила вот такой некрасивый (по крайней мере для меня) и простой текст: «Маша встала рано утром от мешающих лучиков солнца, протерла глаза и свесила ноги с кровати. Темноволосая осмотрелась и заметила подарок в коробке возле кровати. Она протянула руку и открыла подарок».
Как нам предлагает изменить текст YandexGPT: 1) «Маша проснулась ранним утром из-за яркого солнечного света. Она потянулась в постели и опустила ноги. Осмотревшись вокруг, она заметила коробку возле кровати, а в ней подарок. Не спеша, она подошла к коробке и открыла ее». 2) «Маша проснулась рано из-за солнечных лучей, проникающих в ее комнату. Она потянулась на своей постели и спустила ноги. Когда она осмотрелась, то увидела коробку, стоящую на ее кровати. Она подошла и осторожно открыла коробку. Внутри оказалась ее любимая игрушка, которую она давно хотела. Маша была очень рада, что получила такой замечательный подарок».
Конечно, слишком много повторов местоимения «она», НО! Прошу заметить, что тут уже есть деепричастие и появляются чувства Маши. Соединив все три версии и добавив несколько слов, можно получить вполне нормальный текст: «Маша проснулась ранним утром из-за яркого солнечного света, проникающего сквозь шторы в её комнату. Девочка потянулась в постели и опустила ноги. Осмотревшись вокруг, она заметила подарочную коробку возле кровати, подошла и осторожно открыла. Внутри оказалась ее любимая игрушка, которую она давно хотела. Маша была очень рада, что получила такой замечательный подарок». Вот такой красивый Франкенштейн получился. И да, слова по типу «темноволосая» как заменитель имени, лично для меня, выглядят отвратительно, пару раз в тексте я перенесу, но не когда прилагательное заменяют именем через раз. Так что его отсутствие только в плюс.
Ещё YandexGPT способен написать скучные диалоги. Сколько раз я ни просила выдать нейронку хоть что-то наполненное смыслом, ничего кроме куцых фраз не получалось. Возможно, через некоторое время у неё получится писать хорошие диалоги, но сейчас это на подобии: «Привет, привет, как дела? Хорошо, а у тебя? Отлично, Пока, до свидания».
Может создать неплохую статью про засолку огурцов, выдать короткий текст на заданную тему. Также очень хорошо подскажет вам в правилах русского языка и объяснит расстановку запятых после союзов или вводных слов, можете попросить примеры текста, она вам их выдаст. Можно заставить придумать отрывок с нужной для вас фразой. Поможет составить письмо кому-либо, а для некоторых это особо важно. Поверьте, есть люди, не знающие общих правил делового письма и их отличий от переписки с подружкой. Видела я работы, в которых авторы прописывали супер-пупер холодного и расчетливого бизнесмена, который писал деловые письма из серии: «Приветики-пистолетики, зайди в мой кабинет и отчет на стол. Чмоки!» Я, конечно, утрирую, но смысл вы уловили. И это не было отдельным тропом для показания черты характера. Текст для примера не найду, ибо такое не сохраняю и стараюсь забыть, как страшный сон. Думаю, что с помощью YandexGPT можно вдохновиться на написание своей истории. Ну а что, соавторство с нейросетью, звучит же интересно? Вдруг вам понравится идея или зацепит какая-нибудь фразочка?
Стоит здесь же упомянуть, что у Яндекса есть своя программа с нейросетью под названием «Шедеврум». На момент написания статьи она не особо то и популярна: всего 1млн+ скачиваний на Play Market, что означает, что диапазон людей, скачавших приложение более 1 миллиона, но менее 5 миллионов. В приложении можно попросить Яндекс создать картинку или текст по описанию. Выдаёт он очень неплохие работы, можете сами в этом убедиться, посмотрев в интернете. Пишет точно такие же тексты, что и в браузере Яндекса. А главное, всё бесплатно и быстро!
Я считаю, что для нейронной сети, которая обучается каких-то два месяца это уже огромные положительные результаты! Тот же ChatGPT в своих первых версиях выдавал обрубки фраз. И да, YandexGPT встроен во всеми известную Алису, и вы можете надиктовать ей текст устно или, если есть колонка от Яндекса, запускать функцию на ней. Просто скажите ей «Алиса, давай придумаем», и она запустит нужный навык. У YandexGPT нет ограничений на количество запросов в день, пиши, сколько душе угодно. У того же ChatGPT тексты хоть и выходят покрасивее, но лимит в виде десяти запросов за весь период смущает. Можно, конечно, устроить пляски с бубном и сделать все бесплатно, но зачем?
Естественно, труд фикрайтеров и писателей в целом, нейросети вряд ли когда-либо полностью уничтожат. Но я бы с радостью почитала книгу, которую бы полностью написала нейросеть. Кстати, такая уже есть. В издательстве Individuum вышел сборник рассказов «Пытаясь проснуться», написанных писателем и Павлом Пепперштейном и генеративной нейросетью ruGPT-3, разработанной командой SberDevices. И да, в этой статье не будет разбора нейронки от Сбербанка, ибо как по мне, пишет она тотальный бред. Зацепиться за отдельную фразу можно, но вряд ли получится. Поэтому труды Пепперштейна для меня особенно удивительны и интересны, видно, что человек именно переписывал и каким-то чудом вдохновлялся текстом нейросети.
Несмотря на доводы людей, что тексты нейросетей бездушные и сухие, могу сказать, что это не так. Рассказы Пепперштейна неплохие и как раз доказывают моё мнение, что с нейросетями можно писать в соавторстве. Люди 30 лет назад на интернет ругались, говоря, что как же так книжки все заменит а-та-та, а по итогу всемирная паутина содержит в себе массу полезной информации. Бреда и хлама, правда тоже много, но тем не менее! Вывод: спустя год-два вы не узнаете YandexGPT и будете поражаться логическим и интересным поворотам сюжета в написанном тексте по вашему запросу, а диалоги будут удивлять своей адекватностью. Учитывая, что Алиса популярна, у нейросети Яндекса есть все шансы развиться до интеллекта подростка и писать удачные работы. Сейчас нейросеть хороша в качестве дополнительного источника вдохновения. Определенно, писатели могут оживлять и делать тексты значительно лучше и осмысленнее, чем нейросети.
P.S. Скажу вам по секрету, что я пару раз вставляла короткие отрывки, написанные нейросетью в свои фанфики. Никто этого не заметил, да и вообще ну никак нельзя увидеть пару строк нейронки между диалогов. Всем удачи!
Примечания:
Пишите свое мнение про нейросети