Имя: Пароль:
1C
 
PDF -> TXT (или Excel) средствами 1С
0 Smile
 
12.05.11
13:05
Всем привет!!
Подскажите пожалуйста, как можно прочитать данные из PDF файла или сначала преобразовать в txt, а потом уже прочитать? может есть ссылка, где почитать об том? помогите, очень срочно надо (
1 Гефест
 
12.05.11
13:06
PDF из сканера небось?
2 Smile
 
12.05.11
13:11
не нормальный, дело в том, что поставщик присылает счета в пдф формате, и бухгалтерии приходится руками вытаскивать из каждого письма (а их 50 штук) этот пдфник и отсылать его адресату и все ессесно руками, вот хотелось бы автоматизировать такой процесс.
я хотела сделать как - вытащить из файла номер лицевого счета (эта информация всегда в одной и той же строчке), сравнить с неким соответствием (например из регистра сведений), а потом отослать по почте адресату.
3 Гефест
 
12.05.11
13:16
Не в ту сторону копаешь. Начинать надо с поставщика, чтобы присылал нормальные документы и не выйоживался
4 Aprobator
 
12.05.11
13:16
(2) так что требуется то? Переслать письмо? 1С - тут при чем? В почтовике правила не настроить?
5 Armando
 
12.05.11
13:17
ИзвлечениеТекста (TextExtraction)
Свойства:

ИмяФайла (FileName)

Методы:

Записать (Write)
ПолучитьТекст (GetText)

Конструкторы:

По имени файла

Описание:

Предназначен для извлечения текста из файлов произвольного формата. Используется только для операционных систем MS Windows NT 4.0, 2000, XP.

Доступность:

Тонкий клиент, сервер, толстый клиент, внешнее соединение.
6 Aprobator
 
12.05.11
13:17
(3) для пересылки то какая разница в каком формате?
7 Aprobator
 
12.05.11
13:17
(5) из ПДФ???
8 Smile
 
12.05.11
13:24
надо вытащить данные из пдф файла программно средствами 1С 8
9 Smile
 
12.05.11
13:24
+(8) ессесно не меняя его при этом
10 Armando
 
12.05.11
13:26
(7) думаю да. не проверял. из ворда точно вытаскивает.
11 palpetrovich
 
12.05.11
13:27
(10) думаю - напрасно так думаешь :)
12 Armando
 
12.05.11
13:27
яндекс же индексирует некоторые пдфки. здесь скорее всего такой же принцип.
13 Armando
 
12.05.11
13:27
(11) ты проверял?
14 aleks-id
 
12.05.11
13:28
...и вот они встретились... v8: 8.1 конвертер mxl to tif
15 Aprobator
 
12.05.11
13:29
зачем вытаскивать, чтобы потом тоже самое пересылать? Исходный текст письма не нужен что ли?
16 Armando
 
12.05.11
13:31
Извлекает текст из файла. Тип файла определяется по расширению файла (т.е. текст из файла с расширением .tmp извлечен не будет). Для извлечения текста из файлов используется интерфейс IFilter. Он является расширяемым. Можно установить дополнительные модули, чтобы появилась возможность извлекать текст из еще одного типа файлов. По умолчанию текст извлекается из файлов следующих типов (имеющих расширение): ASCX, ASP, ASPX, CSS, HHC, HTA, HTM, HTML, HHT, HTW, HTX, ODC, STM, DOC, DOT, POT, PPS, PPT, XLB, XLC, XLS, XLT, TXT, EML. Подразумевается, что файлы с расширением TXT - это текстовые файлы в кодировке ANSI или UNICODE (UTF-16).
17 Armando
 
12.05.11
13:33
У меня из пдфа только что извлекся текст
18 Lama12
 
12.05.11
13:33
(0)Если текстовый слой есть то (5) подойдет.
Если (5) не подойдет, то печать pdf  в текст с помощью универсального принтере (не помню как называется есть во всех поставках винды драйвер, что-то типа генерик текст онли), затем анализировать текстовый файл.
Если принтер ничего не печатает, то текстового слоя в pdf нет.
19 Evgenchik
 
12.05.11
13:43
а в фирме поставщика небось программисты 1С до этого думали как сконвертить в пдф и отправить по почте...
20 Armando
 
12.05.11
13:51
Сейчас попробовал левую пдфку расковырять - не вышло. После установки Adobe PDF IFilter v6.0 ( http://www.adobe.com/support/downloads/thankyou.jsp?ftpID=2611&fileID=2457 ) текст извлекся, но в другой кодировке.
21 Rabbit
 
12.05.11
13:52
(19) как пить дать))
22 Smile
 
12.05.11
14:09
ура получилось!!!!!!! всем огромное спасибо, особенно    Armando :)
сделала, как Вы сказали:

файл="C:\Doc187.pdf";
Объект= новый ИзвлечениеТекста(файл);
ТекстФ=Объект.ПолучитьТекст();
Сообщить(ТекстФ);

конечно получился сплошной текст как бы одной строкой, но это не важно, мне оттуда просто нужно вытащить одну цифру, а потом переслать этот файл адресату.

насчет отправки поставщиков из 1С в пдф - да, согласна, наверняка они так и сделали, по крайней мере видно что документ не сканированный, но из 1С - ПДФ я знаю как сделать, а вот наоборот была проблема :)
23 palpetrovich
 
12.05.11
14:41
(20) у меня не получается извлечь, pdf-ы - они разные...
Требовать и эффективности, и гибкости от одной и той же программы — все равно, что искать очаровательную и скромную жену... по-видимому, нам следует остановиться на чем-то одном из двух. Фредерик Брукс-младший