![]() |
![]() |
![]() |
|
MySQL умеет искать по "связанным словам" | ☑ | ||
---|---|---|---|---|
0
Волшебник
модератор
14.04.05
✎
21:58
|
С версии MySQL 4.1.1 полнотекстовый поиск поддерживает технологию "расширение запроса" (в особенности, вариант "слепое расширение запроса"). Это обычно полезно, когда поисковая фраза слишком коротка. Это часто обозначает, что пользователь полагается на "подразумеваемое знание", которое поисковые движки обычно игнорируют.
Например, поисковый запрос пользователя "база данных" может на самом деле значить "MySQL", "Oracle", "DB2" и "1С". Все эти фразы соответствуют запросу "база данных" и должны быть также включены в результат. Это подразумеваемое знание. "Слепое расширение запроса" (также известное как автоматическая релевантная обратная связь) задействуется добавлением конструкции "WITH QUERY EXPANSION" после поисковой фразы. При этом поиск выполняется дважды. Поисковая фраза для второго поиска содержит оригинальную поисковую фразу плюс несколько слов, связанных с документами, содержащимися в верхней части результата первого поиска. Таким образом, если один из этих документов содержит слово "база данных" и слово "MySQL", то второй поиск найдет документы, содержащие слово "MySQL", даже если они не содержат слово "базы данных". Следующий пример иллюстрирует это различие: SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('базы данных'); +----+-------------------+------------------------------------------+ | id | title | body | +----+-------------------+------------------------------------------+ | 5 | MySQL vs. YourSQL | При сравнении этой базы данных ... | | 1 | MySQL Tutorial | БД является сокращением для "базы данных"| +----+-------------------+------------------------------------------+ 2 rows in set (0.00 sec) SELECT * FROM articles WHERE MATCH (title,body) AGAINST ('базы данных' WITH QUERY EXPANSION); +----+-------------------+------------------------------------------+ | id | title | body | +----+-------------------+------------------------------------------+ | 1 | MySQL Tutorial | БД является сокращением для "базы данных"| | 5 | MySQL vs. YourSQL | При сравнении этой базы данных ... | | 3 | Optimizing MySQL | В этом руководстве по MySQL мы покажем...| +----+-------------------+------------------------------------------+ 3 rows in set (0.00 sec) Другой пример может быть поиском книг "Джорджа Сименона" (Georges Simenon) о "Мейгрет" (Maigret), когда пользователь не уверен, как пишется "Мейгрет". Поиск по словам "Мегре и сопротивляющиеся свидетели" без расширения запроса найдет только "Мейгрет и сопротивляющиеся свидетели". Поиск с расширением запроса найдет все книги со словом "Мейгрейт" на втором проходе. Замечание: Поскольку слепое расшинение запроса значительно стремится повысить шум путем выдачи нерелевантных документов, будет благоразумным его использовать только когда поисковая фраза достаточно коротка. http://dev.mysql.com/doc/mysql/en/fulltext-query-expansion.html Перевод мой. См. также: OFF: Улучшение поиска по форуму - сбор предложений Новая технология поиска для Яндекса ТехИнфо: релевантность результата поиска по форуму ТехИнфо: улучшен поиск |
|||
1
romix
15.04.05
✎
02:17
|
Да тут имхо конкретный шум можно получить. :-)
Вплоть до "вечернего звона". :-) С другой стороны, я так понимаю, что движок найдет, к примеру, первые 3 самые релевантные статьи по данному запросу, там отыщет 3 самые часто встречающиеся слова, и воткнет их в поисковый запрос во втором проходе... хм, вроде как ассоциативное мышление получается. Именно так, по всей видимости, работает "неокортекс, или новая кора головного мозга, а более конкретно - часть неокортекса, называемая ассоциативной областью. Именно эта область мозга отвечает за получение информации, происходящей от лимбической системы, определяя относительную важность информации, сравнивая эту информацию с прошлым опытом, выбирая подходящую реакцию на эту информацию и предсказывая ее последствия. Она делает это, посылая химические сообщения по синапсам со скоростью 120 метров в секунду через громадную сеть из миллиардов клеток без начала и конца". (Брюс Фогл, "О чем думает собака"). |
|||
2
Волшебник
модератор
15.04.05
✎
07:43
|
(1) "сеть из миллиардов клеток без начала и конца"
Даже у Интернета есть начало и конец. Начало здесь: http://sonora.buhoy.ru/beginning.htm Конец здесь: http://otherdima.spb.ru/pricols/last.html |
|||
3
romix
15.04.05
✎
17:06
|
(2) У ножниц и то нет одного конца. :-) Их как минимум 2. :-)
|
Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |