Кратко:
Продолжаем наш разговор про нейросети и их пользу для незрячих людей.
23.01.2026
Кратко:
Продолжаем наш разговор про нейросети и их пользу для незрячих людей.
В первой части статьи мы отказывались от интеллекта, боролись с галлюцинациями, смотрели клипы и переставали смеяться.Во второй части нейросети нас не отпустят. Глубокое погружение обеспечено! Не нажимайте Alt + F4!
На чем мы остановились? Ах да, на поиске победителя среди генераторов картинок!
Оригинальные картинки мне становились нужны все чаще. Завела два канала на YouTube — там без изображений никак. Даже музыку во «ВКонтакте» теперь не выложить без прикрепленной картинки. Однажды потребовалось создать изображение, которое поставило почти все известные мне нейромодели в тупик.
Вот какой запрос нейросетям я дала: «Создай изображение: раннее солнечное утро, уютная кухня. На газовой плите в турке варится кофе. На небольшом кухонном диванчике разлегся пушистый серый кот».
За десятки попыток не справились ни «Шедеврум», ни «Кандинский», ни Stable Diffusion 3, ни MidJourney.И тогда я попробовала нейросеть Gemini от Google. Получилась картинка, близкая к идеалу.
Не стала искать добра от добра, остановилась на Gemini. К MidJourney иногда обращаюсь, но она платная, да и создает не одно изображение по запросу, а коллаж из четырех. Нужно выбирать, увеличивать, заново создавать выбранное. Не совсем то, что хочется рекомендовать незрячим друзьям.
А буквально на днях в гонку лучших включился ChatGPT. Данная нейросеть научилась создавать картинки, причем умеет делать логотипы, обложки и баннеры с текстом практически на любом языке.
Надо сделать открытку с яркой надписью: «С днем рождения, дорогая подруга!»? ChatGPT справиться, и даже бесплатно!
За последние полтора года провела немало вебинаров по нейросетям для незрячей аудитории. И всякий раз меня спрашивали о telegram-ботах, посредством которых можно получить доступ к той или иной нейросети, а лучше ко многим сразу.
О Telegram-ботах я говорю с большой осторожностью. Во-первых, сегодня они работают, а завтра — нет. Увы, стабильность — не их конек. Во-вторых, они зачастую условно бесплатные. Нам пообещают бесплатный доступ, а через несколько обращений попросят денег. Мы заплатим, но кто гарантирует, что бот вскоре не прикажет долго жить? В-третьих, безопасность наших данных. Да, для кого-то это важно.
И, наконец, бесплатный сыр… Даже если денег с нас не потребуют, то предложат для доступа к боту подписаться на дюжину сомнительных каналов.
В общем, советую по возможности пользоваться оригинальными сайтами нейросетей. Сайты зачастую англоязычные, но минимального знания языка вполне хватит для работы с ними. На сайте (или в оригинальном приложении) взаимодействие с нейромоделью происходит быстрее, чем в ботах-посредниках.
Однако есть не только telegram-боты, но и сайты-посредники, упрощающие нам доступ к различным нейросетям. Такие сайты предоставляют доступ или по подписке, или по запросу, когда пополняешь баланс на определенную сумму, и за каждое обращение к нейромодели часть денег списывается, и так пока не исчерпается вся сумма на счете.
Если планируем обращаться к нейромоделям много и часто, система подписки вполне подойдет. Если от случая к случаю, например, не больше пяти, десяти запросов в неделю, ищем сайт-посредник с пополнением баланса.
Может ли нейросеть работать как поисковик? Да, если у нее есть доступ не только к собственной базе, на которой эта нейромодель обучалась, но и ко всемирной паутине.
Например, если база знаний Chat GPT обновлялась последний раз в октябре 2023-го, бесполезно спрашивать нейросеть о книжных новинках года текущего.
А вот DeepSeek, Perplexity или Yandex GPT мы можем попросить: «Найди десять новостей из области высоких технологий за последнюю неделю, со ссылками на источники!»
На мой взгляд, лучше всего с подобными запросами справляется Perplexity: ссылки всегда рабочие, информация соответствует запросу.
А написать за нас сочинение? О, боюсь, это разговор для отдельной большой статьи: какие тексты, какая нейромодель может написать, как правильно составлять запросы (промпты)…
Главное, что, если с невизуальной доступностью у сайта нейросети все хорошо, то попросить написать текст, а затем прочитать и сохранить его себе, незрячий человек сможет без проблем.
Лично я все тексты пишу сама. Такую работу нейросети не доверяю. Во-первых, слишком много специфики, во-вторых, пришлось бы перепроверять каждый факт, внимательно вычитывать, редактировать. Проще написать самой.
Да, какие-то наброски, формальные, шаблонные тексты почти любая нейросеть создать может; они будут разной степени информативности, длины, проработки, но в этом не будет… души?
Хуже! В таких текстах не будет осмысленности, понимания, для чего здесь то или иное слово, для кого данный текст написан и какой посыл он несет.
Опять же, интеллекта здесь нет. Нейросеть не стремится нас, читателей, порадовать, разочаровать, вызвать иные эмоции. Она лишь пережует то, чем ее накормили, и соберет текст из «переваренных» фрагментов.
Само по себе это ни хорошо, ни дурно. Просто не стоит ждать, что нейросеть сделает работу за нас.
Больше четверти века я пишу стихи. Больше двадцати лет — тексты песен.Всегда мечтала, чтобы они звучали: на радио, со сцены, не важно, где, только бы звучали. Показывала свои тексты разным исполнителям и музыкантам: любителям и профессионалам, незрячим и видящим. Увы, почти ни одной коллаборации не случилось.
Нужно ведь, чтобы артист захотел исполнить песню на текст, а композитор сумел написать подходящую музыку. Мечты мои таковыми и оставались до марта 2024 года.
Тогда я узнала о Suno — нейросети, которая за несколько минут превращает текст в готовую песню.Так зародилось наше сотворчество: от меня — строки, от Suno — музыка и вокал.
В Suno, тогда еще версии 2.0, создавала первые двухминутные треки. Приходилось их продлевать, склеивать, даже отдавала знакомому композитору на доработку, чтобы песня не обрывалась внезапно или не звучала слишком электронно.
Теперь по подписке доступна версия Suno 4.5, не раз поменялся интерфейс сайта, расширяется функционал самой нейросети, творить с ее помощью становится все интереснее.
Пробовала работать и с другими «поющими» нейросетями: Udio и Riffusion.
У Udio довольно сложный интерфейс, развивается она очень медленно. Треки в ней можно создавать до сих пор не длиннее двух минут; потом нужно продлевать, собирать, склеивать. Да и сама нейросеть довольно капризна. Каков бы ни был запрос, результат зачастую непредсказуемый.
Я называю Udio нейросетью для гиков, ну или для продвинутых.
Несколько месяцев назад начала осваивать другую нейросеть, Riffusion. До недавнего времени она была полностью бесплатной, сейчас некоторые функции доступны только по подписке. С невизуальной доступностью у сайта Riffusion на «четверку», приспособиться можно, если запомнить порядок и функции неподписанных кнопок.
С русскоязычными текстами, по моим наблюдениям, Riffusion работает пока не очень хорошо: смазывает слова, теряет ударения. Но нейросеть быстро развивается.
Для меня на данный момент Suno вне конкуренции. Огромное разнообразие жанров, сочный вокал, приятное звучание, пусть и не идеальное, инструментов.
А что там с транскрибацией? Хорошо смеется тот, кто не смеется над нейросетями.
Приходится признать, что во многих случаях — когда качество аудио приемлемое, когда спикеры не говорят одновременно, когда речь говорящего не сильно искажена — нейросеть отлично справляется с превращением речи в текст.
Однажды обрабатывала интервью с космонавтом: профессиональная лексика, некоторые особенности дикции, быстрая речь. И нейросеть справилась почти на сто процентов.
Как мы знаем, не все книги существуют в аудиоверсии. И вот, дилемма: читать текстовую книгу синтезатором речи или ждать, когда (и если) она выйдет в звуке. А вдруг выйдет, но начитка нам не понравится?
Многие привыкли читать книги синтезаторами речи, которыми и без того постоянно пользуются. Для кого-то эти голоса кажутся слишком неестественными, монотонными.
Что же делать? «Скормить» нейросети текст и получить на выходе аудиокнигу. Какого качества? Зависит от конкретной модели.
Если «скармливать» не хочется, некогда со всем этим разбираться, достаточно установить приложение «Яндекс. Книги». Многие произведения там уже доступны в прочтении нейроголосов «Яндекса».
Нейродикторы иногда неправильно ставят ударение в словах, иногда ошибаются с интонацией, но в целом, скажу вам, качество более чем достойное.
В феврале прошлого года у меня стали появляться ученики, зрячие и незрячие, которым интересно освоить работу с нейросетями. Мы создаем картинки, делаем песни, придумываем контент-планы, разрабатываем тесты на знание английского, анализируем длинные тексты в поисках какой-нибудь детали, превращаем часовые видеолекции в удобный конспект.
Нейросеть может нам помочь изучить новый язык, разобраться в сложном материале, проанализировать громоздкие таблицы, стать более творческими. Главное, использовать этот инструмент, как и любой другой, с умом.
Нейросети. Дружить, нельзя бояться! Теперь мы знаем, где поставить запятую!