Индийский программист с говорящим именем Анимеш Каневар создал нейросеть, которая может нарисовать человека, опираясь на текстовое описание его внешности. Об этом сам автор рассказал в своем блоге.
Индиец взял за основу две уже использующиеся нейросети. StackGAN создает фотореалистичные изображения по описанию, а ProGAN позволяет создавать высококачественные изображения людей. Таким образом, от первой программы он взял функцию переработки текста в вектор, а для непосредственного создания изображений использовал вторую программу. ProGAN способна постоянно совершенствовать изображения за счет увеличения количества слоев и разрешения.
Чтобы обучить свой искусственный интеллект, программист использовал 400 фотографий и соответствующих им текстовых описаний. Анимеш признает, что получающиеся изображения далеки от реалистичных, однако в них уже можно узнать описываемого человека.
Процесс обучения нейросети представлен в видеоролике.