Главная > Синонимайзер > Синонимайзер v.0.1

Синонимайзер v.0.1

Пару недель назад возникла острая необходимость в синонимайзере. Походив по сайтам, на которых есть онлайн-синонимайзеры, был немножко разочарован их качеством синонимирования. В основном все они были построены на базах, которые выложены в паблик и алгоритм замены слов был построен кое-где на обычном рандоме и очень часто попадались фразы совсем не вписывающиеся в контекст предложения.

К примеру, в предложении:
Главным направлением антикризисной программы в России станет поддержка детей и пенсионеров.
была произведена замена:
Главным направлением антикризисной программы в Ансамбль танцы и песни советской армии станет поддержка детей и пенсионеров.

Платить за платные версии не было никакого желания, поэтому было решено попробовать написать свой вариант синонимайзера. Была собрана база синонимов в размере 20к слов в нормальной форме (для глаголов – инфинитивы, для существительных – ед. число, им. падеж и т.д.) и около 500к производных форм от этих слов.

Так как синонимайзер должен был быть частью одной большой системы, написанной на PHP, то он также писался на этом же языке как PHP-класс.

Из достоинств скрипта можно отметить:

  • умеет склонять слова, например: «на красивом столе» — «на прекрасном столе»
  • умеет преобразовывать числа в слова, например: «от 50 до 70» — «от пятидесяти до семидесяти»,
  • текст получается более-менее читабельным,
  • умеет менять в словах русские символы на аналогичные латинские,
  • умеет делать в словах ошибки,
  • не портит html-разметку.

Из недостатков:

  • заменяет только единичные слова на единичные синонимы,
  • текст все же получается не настолько читабельным, чтобы можно было его постить на белых сайтах.

Результаты работы синонимайзера можно протестировать на этой страничке.
В планах на будущее — написать синонимайзер для ангийского языка.

Ниже приведу источники, откуда я черпал информацию для построения своего синонимайзера:

  • Блог интернет-разработчика от Владимира Жилинского. Владимир выложил в паблик отпарсенную базу синонимов словаря Абрамова, за что ему огромное спасибо.
  • SLOVARIchKI — Содержит базу синонимов на 90 000 слов. В словаре встречаются сплошь и рядом маты, так что используйте ее с умом, иначе можете увидеть строки типа: «Он сильно ударил его в плечо!» — «Он сильно ёбнул его в плечо!»
  • http://blogka.ru/ — база синонимов на 300 000 слов, есть сразу дамп в sql-формате.
  • SEO блог — автор поделился опытом наполнения ГС синонимизированным текстом и ссылкой на базы синонимов.

Popularity: 2%

Синонимайзер , ,

  1. Alex
    26 Мар 2009 из 16:25 | #1

    синонимайзер на http://www.best-scribbler.ru посмотри

  2. 26 Мар 2009 из 17:10 | #2

    Функционал богатый!

  3. Креатив
    09 Апр 2009 из 22:45 | #3

    А как в дальнейшем будет развиваться твой проект с Синонимайзером? Вещь очень полезная и нужная, при условии его работоспособности.

  4. 10 Апр 2009 из 7:54 | #4

    Сейчас он дорабатывается и тестируется. Отдельно пока не планирую его развивать, пока что он идет как часть другой системы.

  1. Трекбеков пока нет.