MySQL БД синонимов русского языка
Как-то понадобилась мне для реализации идеи по оптимизации выдачи поисковых запросов на сайте одного лабаза словарь синонимов русского языка в виде mysql или sqlite базы данных. Гугл по запросам выдавал лишь б-гомерзкие сайты аля плати.ру и прочую коммерческую хуиту, где эти базы данных можно было скачать, отправив смс-ку на котороткий номер стоимостью под 15 баксов. Из-за генетического инстинкта жадности, платить барыгам не хотелось. И в то же время в интернетах были найдены десятки словарей в формате txt, которые я и решил разобрать в mysql. Процесс длился ни много не мало - целые сутки, в результате получилась mysql база данных на 193409 слов и размером sql файла на 11 с лишним мегабайт. Скачать результат в сдавленном zip-ом виде можно вот тут:
rus_synonyms_mysql.zip (~3,3 mb). Пару слов о том, как использовать. Для начала получаете id слова запросом
SELECT id FROM words WHERE word='Профит'. После этого получаем список синонимов
SELECT w_id, s_id FROM synonyms WHERE w_id='1234' or s_id='1234'. Сортируем повторяющиеся значения и забираем слова-синонимы
SELECT word FROM words WHERE id IN (1,2,3,4,5 ...). Умные дядьки объединят все запросы в один большой и будут счастливы. Да, слова "хуй" (3991 синоним) и "Ленин" (10 синонимов) в базе имеются.