Синонимайзер v.0.1
Пару недель назад возникла острая необходимость в синонимайзере. Походив по сайтам, на которых есть онлайн-синонимайзеры, был немножко разочарован их качеством синонимирования. В основном все они были построены на базах, которые выложены в паблик и алгоритм замены слов был построен кое-где на обычном рандоме и очень часто попадались фразы совсем не вписывающиеся в контекст предложения.
К примеру, в предложении:
Главным направлением антикризисной программы в России станет поддержка детей и пенсионеров.
была произведена замена:
Главным направлением антикризисной программы в Ансамбль танцы и песни советской армии станет поддержка детей и пенсионеров.
Платить за платные версии не было никакого желания, поэтому было решено попробовать написать свой вариант синонимайзера. Была собрана база синонимов в размере 20к слов в нормальной форме (для глаголов – инфинитивы, для существительных – ед. число, им. падеж и т.д.) и около 500к производных форм от этих слов.
Так как синонимайзер должен был быть частью одной большой системы, написанной на PHP, то он также писался на этом же языке как PHP-класс.
Из достоинств скрипта можно отметить:
- умеет склонять слова, например: «на красивом столе» – «на прекрасном столе»
- умеет преобразовывать числа в слова, например: «от 50 до 70» – «от пятидесяти до семидесяти»,
- текст получается более-менее читабельным,
- умеет менять в словах русские символы на аналогичные латинские,
- умеет делать в словах ошибки,
- не портит html-разметку.
Из недостатков:
- заменяет только единичные слова на единичные синонимы,
- текст все же получается не настолько читабельным, чтобы можно было его постить на белых сайтах.
Результаты работы синонимайзера можно протестировать на этой страничке.
В планах на будущее – написать синонимайзер для ангийского языка.
Ниже приведу источники, откуда я черпал информацию для построения своего синонимайзера:
- Блог интернет-разработчика от Владимира Жилинского. Владимир выложил в паблик отпарсенную базу синонимов словаря Абрамова, за что ему огромное спасибо.
- SLOVARIchKI – Содержит базу синонимов на 90 000 слов. В словаре встречаются сплошь и рядом маты, так что используйте ее с умом, иначе можете увидеть строки типа: «Он сильно ударил его в плечо!» – «Он сильно ёбнул его в плечо!»
- http://blogka.ru/ – база синонимов на 300 000 слов, есть сразу дамп в sql-формате.
- SEO блог – автор поделился опытом наполнения ГС синонимизированным текстом и ссылкой на базы синонимов.
Popularity: 8%
отношения в семье бисексуалов
синонимайзер на http://www.best-scribbler.ru посмотри
Функционал богатый!
А как в дальнейшем будет развиваться твой проект с Синонимайзером? Вещь очень полезная и нужная, при условии его работоспособности.
Сейчас он дорабатывается и тестируется. Отдельно пока не планирую его развивать, пока что он идет как часть другой системы.