|
ДО 3.0 Автоматическая адресация входящих писем | ☑ | ||
|---|---|---|---|---|
|
0
xraf
28.04.26
✎
12:38
|
Суть задачи :
Делопроизводитель регистрирует входящую корреспонденцию, сканирует и прикрепляет. 1С должна этот файл распознать и поставить задачу на исполнение по данному письму. Дружить с ИИ? |
|||
|
1
vicof
28.04.26
✎
13:24
|
Не, бить заказчика
|
|||
|
2
Garykom
гуру
28.04.26
✎
13:24
|
(0) Не хочу огорчать но ИИ вам для данной задачи выйдет не дешевле чем платить зарплату паре девочек
|
|||
|
3
Garykom
гуру
28.04.26
✎
13:27
|
ИИ это не удешевить
ИИ это дороже но быстрей и на больших объемах Если у вас там сотни и тысячи документов в секунду, ну пусть хотя бы в минуту То да, вам нужен ИИ и пофиг на процент ошибок Но если у вас смешные объемы - наймите человека... |
|||
|
4
xraf
28.04.26
✎
14:14
|
(3) вроде же есть бесплатные модели уже, скормить ей сканы прошлых лет
|
|||
|
5
Garykom
гуру
28.04.26
✎
14:22
|
(4) Эмм. Советую изучить тему LLM.
Обучить свою модель встанет в такие деньги что всего бюджета конторы не хватит. Готовую большую модель крутить у себя - тоже на железе и счетах за электричество разоритесь. Облачную? На счетах за токены аналогично разоритесь, но не сразу. И требуется стабильный канал. И самое главное готовы все свои входящие документы отправлять в облако? Неважно чье. А 152-ФЗ и прочее учли? Там сча ипут даже за трансграничную передачу между своими серверами. Но самая большая проблема готовой модели - размер контекста! |
|||
|
6
xraf
28.04.26
✎
14:28
|
(6) У меня есть куча старых pdf и назначенный по ним сотрудник, распознать их контекст
|
|||
|
7
Garykom
гуру
28.04.26
✎
16:51
|
Чисто теоретически задача конечно решаема.
Но вряд ли есть объемы чтобы стоило браться ее решать. Например нанять спеца по ML, чтобы обработал сканы прошлых лет. Сначала прогнал через распознавание - это будет не быстро или дорого. Затем выделил ключевые признаки, создал обучающую выборку и контрольные - тут нужны будут офигенные объемы, примерно так в миллионы документов. Точнее объемы выборок зависят от кол-ва вариантов распределения. Далее когда данные для обучения и контрольные выборки готовы - можно приступать или к обучению своей модели. Или к файнтюнингу готовых. Файнтюнинг он дешевле, но сама модель денег стоит! Почти все "бесплатные" модели в паблике они бесплатны для не коммерческого применения. Как и на железо под готовую много денег надо. Свою модель дико дорого обучать с нуля (или почти с нуля)! Но в итоге будет небольшая и можно крутить на дешевом железе - вместо настоящего кластера GPU хватит дешман-кластера из игровых RTX 5090 или нечто вроде. А вот просто взять большую готовую модель, настроить ее (называется файнтюнинг - дообучение = докидывание своих данных). Встанет очень затратно по железу. Там стоимость одной видяхи от 1.5 ляма рублей! А на кластер надо таких штук 8 или более. Ну и прочее железо, надо же куда-то "видеокарты" втыкать. |
|||
|
8
xraf
28.04.26
✎
14:32
|
(7) у Вас все время "дорого" и "дорого" :)
|
|||
|
9
xraf
28.04.26
✎
14:34
|
(8) Мне нужна локальная бесплатная модель, которая на основе файлов прошлых лет "запомнит" кто за подобные входящие письма отвечал, и "сообщит" об этом в 1С
Неужели это все стоит больших денег? |
|||
|
10
Garykom
гуру
28.04.26
✎
14:37
|
(9) Да.
Человека нанять дешевле, если у вас смешной оборот в десятки или сотни документов в день. |
|||
|
11
xraf
28.04.26
✎
14:38
|
(10) Значит у нас будущее еще не наступило
|
|||
|
12
Garykom
гуру
28.04.26
✎
14:41
|
(11) Не все так плохо, не забываем про прогресс.
Первые компьютеры когда появились? Сколько стоили? Сколько места занимали и кушали энергии? А через сколько они настолько улучшились что теперь обычный человек таскает на себе несколько компьютеров, по мощности легко перекрывающие любые из первых компьютеров. |
|||
|
13
d4rkmesa
28.04.26
✎
14:43
|
(6) Есть сканеры, навроде Kyocera, где можно докупить встроенную функцию создания текстового слоя в сканах (сканы pdf).
(9) Есть бесплатные модели, но все утыкается в системные требования и производительность в токенах. Локальные модели - это небыстро. >>Неужели это все стоит больших денег? Ну, видеокарты нынче стоят уже прилично, так что не бесплатно, да. |
|||
|
14
Garykom
гуру
28.04.26
✎
14:54
|
(13) Спецсканеры не обязательны если качество уже имеющихся сканов приличное.
Но крутить модельку локально денег стоит. https://cloud.mail.ru/public/RsMo/V7jcWKoXk
|
|||
|
15
Garykom
гуру
28.04.26
✎
14:56
|
(14) Вот это оно за 30 сек скриншот локально распознало
На экономичном режиме электропитания Win10 Если на максимальную производительность поменять - будет быстрей, но кулеры воют и кушает сильно больше |
|||
|
16
d4rkmesa
28.04.26
✎
14:58
|
(13) >> Спецсканеры не обязательны если качество уже имеющихся сканов приличное.
Не, сканеры обычные, просто в Киосерах уже давно есть эта функция, но ее не покупают обычно. Как там по факту работает, не знаю, но наличие текстового слоя круто бы помогло. А так, видимо, нужно будет сканы медленно и печально скармливать локальной модели. (14) Это на каком "железе"? 24-32Gb видеокарта? |
|||
|
17
xraf
28.04.26
✎
15:16
|
(15) Нормально :) Там уж в день не так много писем
|
|||
|
18
Garykom
гуру
28.04.26
✎
15:18
|
(16) >Это на каком "железе"? 24-32Gb видеокарта?
Две RTX 5060 Ti по 16Gb
|
|||
|
19
Garykom
гуру
28.04.26
✎
15:39
|
(18)+ Уже жалею что 3-ю такую же видяху сразу не взял
Моделькам места для контекста не хватает, на 48 вместо 32 было бы лучше А видяхи уже подскочили еще цены |
| Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |