Генератор текста

Здесь я расскажу об алгоритме работы генератора текста
Процесс генерации каждого предложения текста состоит из двух этапов:

ПЕРВЫЙ — это генерация правильной синтаксической структуры предложения, состоящей из макросов для подстановки слов. В каждом макросе заключаются грамматические значения слова.

Например, может получиться такой шаблон:
<предлог(пр. п.)> <сущ.(ж.р.,ед.ч.,пр.п.)> <глагол(несов.,наст.вр.,муж.р., перех., ...)> <сущ.(муж.р.,ед.ч.,им.п.)>
Примечание: в записи предлога указывается падеж, в котором должно находиться относящееся к нему слово или словосочетание.

ВТОРОЙ — подмена макросов словами, взятых из морфологического словаря. Для каждого макроса сначала выбираются все слова, отвечающие указанным в нём грамматическим признакам, затем случайным образом выбирается одно и вставляется в предложение.

Для примера составим простейший словарь из слов "по", "в", "река", "лужа", "плывёт", "тонет", "синхрофазотрон", "кирпич", "корабль" и их словоформ.
Тогда, используя синтаксическую структуру, приведённую выше, можем получить такие результаты генерации:
по реке плывёт кирпич
в луже тонет корабль
по луже тонет синхрофазотрон

...

Это примеры предложений, составленных по простейшему шаблону из подлежащего, сказуемого и дополнения. Генератор также способен вставлять определения, причастные и деепричастные обороты, создавать сложноподчинённые и сложносочинённые предложения.

Сайт управляется системой uCoz