Вход | Регистрация
 

Коллеги, а можно ли найти схожие значения не в справочнике Контрагентов, а в Excel?

Коллеги, а можно ли найти схожие значения не в справочнике Контрагентов, а в Excel?
Я
   Гений 1С
 
24.12.20 - 15:15
Ну есть список контрагентов, нужно оценить, много ли там дублей (похожих названий), там могли переименовывать. Ну нужно примерно оценить.
Какая-нибудь обработка поиска дублей умеет из Экселя брать или сперва в 1Сы прогрузить?
   ДенисЧ
 
1 - 24.12.20 - 15:16
Чо?
Ты в екселе работать не умеешь?
   Гений 1С
 
2 - 24.12.20 - 15:18
(1) а там есть функция поиска схожих?
   Kassern
 
3 - 24.12.20 - 15:30
(2) а что для вас "схожих"? например ООО Кабан и ООО Каван это схожие? Или к примеру ООО "Ромашка" и Общество с ограниченной ответственностью Ромашка? А по ИНН/КПП разве не сверить?
   1nvertex
 
4 - 24.12.20 - 16:30
(1) Сводная таблица, счетчик по количеству строк. Не пойдет?
   1nvertex
 
5 - 24.12.20 - 16:30
сорри, (4) для (0)
   mikecool
 
6 - 24.12.20 - 16:51
удаление дублей в эксель есть, гений - с тебя 1500
   ДядяМитяй
 
7 - 24.12.20 - 17:10
(6) дублей или "похожих названий"? читайте ТЗ)))
Можно запросом обойти и через ПОДОБНО со всякими шаблонами сравнивать таблицу саму с собой
   ДядяМитяй
 
8 - 24.12.20 - 17:14
(7) Только в любом случае ООО Ромашка и ИП Ромашко О.О. будут путаться...
   vvspb
 
9 - 24.12.20 - 17:16
(7) ПОДОБН/// "содержит/не содержет"? 
(8) это единичные случаи
Сколько всего контрагентов?
   BeerHelpsMeWin
 
10 - 24.12.20 - 17:18
В таком случае можно узнать, например, про существование функции СЧЁТЕСЛИ.
   Kassern
 
11 - 24.12.20 - 17:22
(8) Это еще меньшее из зол, взять какой-нибудь ООО Лидер, только в свердловской области их более 20 организаций с абсолютно одинаковым наименованием. Не зная ИНН/КПП я бы даже не взялся схлопывать контрагентов, много гемора можно словить в дальнейшем
   МихаилМ
 
12 - 24.12.20 - 17:22
для эксель был плагин нечеткого сравнения строк.
   Базис
 
13 - 24.12.20 - 17:24
Сперва нормализация - "Общество с ограниченной ответственностью" в ООО и подобные.
Потом расстояние Левенштейна - число элементарных перестановок для превращения одной строки в другую. Да, это имеет высокую вычислительную сложность, наверное как куб от количества. https://ru.wikipedia.org/wiki/Расстояние_Левенштейна
   Kassern
 
14 - 24.12.20 - 17:31
(0) можно еще вот таким макаром на питоне. Передаешь 2 строки s1 и s2 на выходе функция тебе возвращает процент схожести:
import difflib

def similarity(s1, s2):
  normalized1 = s1.lower()
  normalized2 = s2.lower()
  matcher = difflib.SequenceMatcher(None, normalized1, normalized2)
  return matcher.ratio()
   Garykom
 
15 - 24.12.20 - 17:52
(0) используй метод триграмм
   Гений 1С
 
16 - 24.12.20 - 19:41
да думаю проще в справочник загнать в пустую конфу и там поиском дублей по похожим наименованиям пройтись
   hhhh
 
17 - 24.12.20 - 19:52
(16) вообще-то там с контактной информацией проблема. Если например 2 дубля контрагента, а в них разные адреса, или телефоны. Всё равно приходится вручную разгребать. А то потеряется нужная информация.

потом фифо и зачет авансов слетает. И в итоге неправильные проводки и бухотчетность. Из-за какого-то дубля всё пересдавать? Оно это надо? Пусть там будут лучше эти дубли, лучше их не трогать.
   Гений 1С
 
18 - 24.12.20 - 19:54
(17) не, мне только понять, много ли дублей в большом списке контрагентов
   Mort
 
19 - 24.12.20 - 20:01
http://catalog.mista.ru/public/635478/

Новый источник данных -> Файл на диске. Выбираешь свой эксель. "Обновить данные".

Новый источник данных -> Локальный запрос. Временные таблицы -> добавить, выбираешь страницу со своим экселем. Временные таблицы -> Получить запрос выборки - готовый запрос к данным экселя. Можно группировать, соединять с данными базы и делать что хочешь.
   Mort
 
20 - 24.12.20 - 20:05
Запрос к временной таблице с первого раза может выдать ошибку. Со второго проходит. Платформа плохо поддерживает свои непопсовые возможности с каждой новой версией.
   Гений 1С
 
21 - 24.12.20 - 21:59
(19) отлично, но придется ещё самому писать запрос на поиск похожих наименований, а поиск дублей это уже умеет
   МимохожийОднако
 
22 - 25.12.20 - 07:00
Если исходные данные уже лежат в Excel, то вполне достаточно типовых функций для сравнения и преобразования данных по ячейкам и строкам. Вопрос умения. Для разовой работы вполне достаточно.
   Гений 1С
 
23 - 25.12.20 - 11:19
короче. загрузил в пустую конфу
   vvspb
 
24 - 25.12.20 - 11:25
(23) ну и?


Список тем форума
Рекламное место пустует  Рекламное место пустует
ВНИМАНИЕ! Если вы потеряли окно ввода сообщения, нажмите Ctrl-F5 или Ctrl-R или кнопку "Обновить" в браузере.