Имя: Пароль:
IT
Наука
ИИ: OFF: Алгоритм для бота, отвечающего на вопросы по 1С
0 Волшебник
 
модератор
17.01.06
12:38
1. Разбить сообщение на слова,
2. Выбросить из них стоп-слова (предлоги, союзы и другие часто употребляемые в русском языке),
3. Привести оставшиеся к исходной форме (возможно задействовать обычный стемминг - отбрасывание окончаний) и к одному регистру,
4. Отсортировать их по чатоте употребления по убыванию.
5. Взять из СЕРЕДИНЫ этого массива N слов.
6. Найти по этим словам статьи или ветки

http://xpoint.ru/forums/internet/marketing/thread/23406.xhtml#226548

В результате мы получим ссылки, в которых с большой вероятностью будет ответ на поставленный вопрос.

Кто-нибудь покритикует этот алгоритм или, что лучше, предложит свой?
1 Diter
 
17.01.06
12:40
(0) Ты лучше скажи - как продвигается работа по книге знаний в виде хелп-файла?
2 Волшебник
 
модератор
17.01.06
12:43
(1) Книга знаний в виде хелп-файла? Первый раз слышу о такой задаче, но мысль интересная. Предлагаю не портить эту ветку, а завести новую. Здесь я бы хотел поговорить про бота.

Кстати, поиск статей он будет осуществлять именно по Книге знаний.
3 КонецЦикла
 
17.01.06
12:44
(2) А это не приведет к тормозам? Люди иногда могут быстрее ответить и умнее
4 Волшебник
 
модератор
17.01.06
12:45
(3) Но иногда они вообще не отвечают. Или опускают новичка ниже плинтуса. Или просто отправляют его в поиск.
5 Diter
 
17.01.06
12:46
(4) А бот будет уметь отвечать "В ЖКК"?
6 Волшебник
 
модератор
17.01.06
12:48
(5) Я думаю, такой ответ недостоин бота. Он машина и с людьми должен быть вежлив и деликатен.
7 Xbase
 
17.01.06
12:51
0 в поиск
8 Diter
 
17.01.06
12:52
(6) А ты уверен, что в книге знаний расписанывсе ЖКК?
9 skunk
 
17.01.06
12:52
не много напрягает 4 пункт данного алгоритма...
10 Волшебник
 
модератор
17.01.06
12:52
(8) Это и не нужно.

(9) Что конкретно не нравится?
11 Rovan
 
гуру
17.01.06
12:56
(0) N = ?
12 Волшебник
 
модератор
17.01.06
12:57
(11) Ну возьмем 5.
13 Вечно живой
 
17.01.06
12:58
в п.6 добавь "разделы СП"
14 Песец
 
17.01.06
13:00
п.4: частота употребления где?
Одно могу сказать - тестировщиков будет в избытке :)
15 Алгоритмист
 
17.01.06
13:02
(0) - обожаю такие алгоритмы! Каким образом подбирается N?
16 АперБотМ
 
17.01.06
13:03
(12) Имхо бота : 20%
17 Волшебник
 
модератор
17.01.06
13:03
(13) Имена объектов, методов и свойств являются в высшей степени ключевыми. По ним легко можно найти фрагменты программ с решением проблемы. Так что ты прав.

(14) Общая по форуму.

(15) Методом научного тыка.
18 Вечно живой
 
17.01.06
13:03
(15) N маловато будет. пусть лучше будет M.
19 skunk
 
17.01.06
13:04
каким образом сортировать то будешь... как частоту использования вычислять
20 Стерва-бух
 
17.01.06
13:04
(2) не поняла - ТОЛЬКО по книке знаний??
21 Вечно живой
 
17.01.06
13:04
(17) тогда еще к (13) ", фрагменты кода в типовых"
22 skunk
 
17.01.06
13:05
(17/14)каким образом обабщищ
23 Xbase
 
17.01.06
13:05
20 ты и не поймешь тема не для тебя создавалась....
24 Песец
 
17.01.06
13:05
N можно сначала сделать параметром запроса,
по умолчанию подставлять наиболее часто употребимое число.
25 Волшебник
 
модератор
17.01.06
13:05
(19) По общей статистике по форуму, заранее составленной.

(20) Да. И еще по базе знаний.
26 skunk
 
17.01.06
13:07
(25)то есть предлагаешь боту заюзать не документированные возможности форума...
27 Андрюха
 
17.01.06
13:09
Использовать в Боте поисковые маски, т.е. "Таблиц*" - это может быть и Таблица, и Таблицу, и Таблице и т.д.
28 Волшебник
 
модератор
17.01.06
13:09
(26) Зачем? Бот может заранее составить эту статистику и периодически ее обновлять, а при основной работе просто ее использовать.

(27) См. пункт 3 - стемминг.
29 Андрюха
 
17.01.06
13:11
(28) Ага, точно. Да, с Ботом будет житуха. Можно про ЖКК будет смело забыть :)
30 Песец
 
17.01.06
13:12
(24+) N указывать в %.
Дать возможность оценки (по желанию автора вопроса) резутьтата
работы бота. Пригодится для улучшении алгоритма, особенно если
один и тот же вопрос задается немного по-разному, меняется N например.
31 skunk
 
17.01.06
13:12
(28)думаю не взлетит... куча трабл есть... ИХМО
32 Волшебник
 
модератор
17.01.06
13:13
(31) Какие траблы? Что мешает их преодолеть?
33 Вечно живой
 
17.01.06
13:15
(28) бота на 1С писать будешь? и стемминг тоже?
34 skunk
 
17.01.06
13:16
"Таблица" "Таблица Значений" "Значение" - все это не связанные между собой понятия... но твой бот будет давать линки на все три... если они попадут в число N
35 Мистадонт
 
17.01.06
13:21
(0) Имхо, взлетит. А потом, по результатам, уже можно будет оптимизировать.

ЗЫ наконец-то энтузиазм Волшебника имхо получил достойную пищу и цель :)
Долой войну форумов, да здравствует честная конкуренция ботов ! ! !
36 Демогоргон
 
17.01.06
13:24
(0) Не всегда самое встречающееся слово самое гланое и ключевое это раз.
2 - иногда словосочетание тоже важно ...
37 Песец
 
17.01.06
13:25
(34) Из N можно, используя статистику, составлять цепи слов (типа цепей Маркова).
(35) Ага, по пятницам будем делать ставки на битве роботов...
"В левом углу ринга миста-терминатор, в правом кубань-потрошитель".
38 Волшебник
 
модератор
17.01.06
13:26
(33) Стемминг уже написан. Почему бы не написать бота на 1С?

(34) Это уже дело техники.

(35) Да, надо с чего-то начать.

(36) Именно по этому слова берутся из середины

(37) LOL!
39 Песец
 
17.01.06
13:28
(37+) Ok,Ok. Не на ринге. По типу "Что Где Когда".
Во фраках и при бабочках.
Зрители задают вопросы и делают ставки.
40 Демогоргон
 
17.01.06
13:29
(38) Регист и получение остатков.
Для получения остатков воспользуется объектом
регОстатки = СоздатьОбъект("Регистр. ...");
41 Демогоргон
 
17.01.06
13:30
(38) Автомат это хорошо но не круто. Это статистика. Я хочу точности. Поэтому база данных, пополняемая вручную где указанна ссылка и что здесь нужно и на какие слова  нужно отвечать ..
42 Волшебник
 
модератор
17.01.06
13:31
(40) Бот выделит ключевые слова "регистр", "остатки", "объект". Что-то не так?
43 Волшебник
 
модератор
17.01.06
13:31
(41) Книга знаний к вашим услугам.
44 Демогоргон
 
17.01.06
13:35
(43) Мля, у меня даже дома времени нет. А то хоть счас бы уже алгоритмы стал писать бы ... Разговор не в счет - ну мона хоть чуть отдохнуть ..
45 evGenius
 
17.01.06
13:40
Как красиво придумал: "Бот, отвечающий на вопросы по 1С". Так бы и сказал, что хочешь переделать поиск по базе знаний.
Нормальный такой алгоритм для нового поискового движка, оптимизированного под 1С, правда доработки требует и столкновения с реальностями жизни.
46 skunk
 
17.01.06
13:44
(38)поживем увидим... я сказал свое мнение по поводу описанного тобой алгоритма... он ведь еще очень далек от реализации... как реализуешь увидим...
47 Токс
 
17.01.06
13:47
Первый шаг к кнопке "Сделать всё!" сделан! Поздравляю!

ЗЫ Как весело было читать переводы первых компьютерных переводчиков...
48 evGenius
 
17.01.06
13:49
(47) Надо еще плагин для OpenConf к 1С сделать, который в зависимости от ситуации будет кидать страницу из БЗ автоматически. :)))
49 Волшебник
 
модератор
18.01.06
12:00
(45) Поиск - это лишь средство. Цель - сделать автономного бота (функционирующего без человека), который будет использовать поиск и еще бог знает что для ответов на вопросы.
50 Антошка WAREZNIC
 
18.01.06
12:19
(49) Интеллект бота превысит интеллект Антошкаф?
51 Волшебник
 
модератор
18.01.06
12:20
(50) Мне кажется, это уже случилось... АперБот рулит.
52 Антошка WAREZNIC
 
18.01.06
12:21
Выходит что... Выходит, что всё это затеяно, чтобы устранить Антошку от мисты? (рыдаю кислотными слезами)
53 skunk
 
18.01.06
12:24
(51)следующим ботом на мисте появится бот... определяющий степень дятлонизма у вопращающего...

желательно, что бы он само совершенствовался...
54 Антошка WAREZNIC
 
18.01.06
12:26
(53) Дятлик самосовершенствовался? Повышал степень самодятлования? Вах!
55 skunk
 
18.01.06
12:27
(54)нет клювик развивал... и затачивал его