Архив

Публикации с меткой «Синонимайзер»

Онлайн синонимайзер VS Онлайн рерайтер

27 мая 2009

С появлением шинглов в алгоритмах Яндекса для определения дубликатов текстов много народу начало думать, как эти шинглы качественно разрушать, чтобы получать уникальный текст из совсем неуникального! Начал думать и я.

Синонимайзер

СинонимайзерПервое, что всем пришло на ум и мне в том числе — простая замена слов на их синонимы. Но при простой замене синонимы частенько искажают смысл, заложенный в текст. То согласование двух слов не соблюдается, например, одно прилагательное идет во множественном числе, а следом существительное в единственном, то слова вообще не вяжутся. В общем, получается не текст, а сплошной бред. Такой бредовый синонимайзер еще пару дней назад был доступен для использования на http://synonyma.ru.

Для улучшения качества синонимизации нужны алгоритмы поиска, подходящих по смыслу, или хотя бы, чтобы соблюдалось согласованность слов. Еще не мешало бы разбить базу синонимов по разным тематикам и в зависимости от тематики текста пользоваться той или иной БД синонимов.

Еще был вариант спрашивать, например, у Яндекс.XML как часто появляется в результатах то или иное словосочетание, но при большой базе синонимов, например, 400к слов, где в среднем на каждое слово приходится по 4 синонима, получается надо сделать 16 000к запросов, а Яндекс.XML разрешает в сутки выполнять не более 1000 запросов. Ждать 43 года, пока отпарсится вся база, совсем не хотелось, поэтому идея отвалилась сама собой. Читать полностью…

Popularity: 8%

Рерайтер, Сервисы, Синонимайзер , ,

Synonyma.ru — онлайн синонимайзер в помощь рерайтеру

Вот я и закончил наконец-то standalone-версию своего синонимайзера, который расположился по адресу Synonyma.ru. Предысторию синонимайзера читайте здесь и здесь.

Synonyma.ru - онлайн синонимайзер в помощь рерайтеру.

Synonyma.ru - онлайн синонимайзер в помощь рерайтеру.

Что нового в этой версии?

  1. Удалены все ограничения на длину текста.
  2. Убраны за ненадобностью фильтры, которые подбирали из списка синонимов для исходного слова наиболее подходящую форму по окончанию, что дало возможность подбирать синонимы случайным образом и увеличить количество замен.
  3. Исправлены баги с html-тегами.
  4. Исправлены баги с заменой чисел на слова.
  5. Исправлены баги со склонением слов и чисел.

Synonyma.ru выполнен в простом стиле: все находится на одной страничке, редактирование текста и выбор синонимов происходит с помощью Ajax. Слова, замененные синонимами выделяются жирным шрифтом.

Прошу любить и жаловать :).

Popularity: 19%

Сервисы, Синонимайзер , ,

Синонимайзер v.0.1

22 Мар 2009

Пару недель назад возникла острая необходимость в синонимайзере. Походив по сайтам, на которых есть онлайн-синонимайзеры, был немножко разочарован их качеством синонимирования. В основном все они были построены на базах, которые выложены в паблик и алгоритм замены слов был построен кое-где на обычном рандоме и очень часто попадались фразы совсем не вписывающиеся в контекст предложения.

К примеру, в предложении:
Главным направлением антикризисной программы в России станет поддержка детей и пенсионеров.
была произведена замена:
Главным направлением антикризисной программы в Ансамбль танцы и песни советской армии станет поддержка детей и пенсионеров.

Платить за платные версии не было никакого желания, поэтому было решено попробовать написать свой вариант синонимайзера. Была собрана база синонимов в размере 20к слов в нормальной форме (для глаголов – инфинитивы, для существительных – ед. число, им. падеж и т.д.) и около 500к производных форм от этих слов.

Так как синонимайзер должен был быть частью одной большой системы, написанной на PHP, то он также писался на этом же языке как PHP-класс.
Читать полностью…

Popularity: 2%

Синонимайзер , ,