Вход | Регистрация
 
1С:Предприятие :: 1С:Предприятие 8 общая

Парсер translate.google.com

Парсер translate.google.com
Я
   IvanGorbunov
 
28.12.18 - 14:39
Пытаюсь сделать перевод путем парсинга гугловского переводчика. Пока не получается даже получить тело html документа по ссылке:
Пишу такой код:

    АдресСайта = "https://translate.google.ru/#view=home&op=translate&sl=en&tl=ru&text=nut";;
    СтруктураАдресаСайта = РазобратьАдресСайта(АдресСайта);
    ИмяВременногоФайлаТекстHTML = ПолучитьИмяВременногоФайла("html");
    
    Попытка
        //подключаемся к домену
        HTTPСервис = Новый HTTPСоединение(СтруктураАдресаСайта.Домен);
        //получаем конкретную страницу сайта и скачиваем ее во временный файл
        HTTPСервис.Получить(СтруктураАдресаСайта.Запрос, ИмяВременногоФайлаТекстHTML);
    Исключение
        Сообщить(ОписаниеОшибки(), СтатусСообщения.Важное);
        Возврат;
    КонецПопытки;
    
    ЧтениеHTML = Новый ЧтениеHTML;
    ЧтениеHTML.ОткрытьФайл(ИмяВременногоФайлаТекстHTML, "UTF8");
    
    ПостроительDOM = Новый ПостроительDOM;
    ДокументHTML   = ПостроительDOM.Прочитать(ЧтениеHTML);

Возвращает ошибку "302 Moved"
 
 
   Вафель
 
1 - 28.12.18 - 14:45
смотри куда же он мувед
   Вафель
 
2 - 28.12.18 - 14:46
это в заголовках должно быть
   IvanGorbunov
 
3 - 28.12.18 - 14:58
(2) Вот он мне говорит, что документ мувед, дальше ссылка на "https://translate.google.ru/";
   Вафель
 
4 - 28.12.18 - 15:05
fetch("https://translate.google.ru/";)
в браузере не выдает 304
   IvanGorbunov
 
5 - 28.12.18 - 15:07
(4) не понял вас)
   Garikk
 
6 - 28.12.18 - 15:15
А зачем его парсить если api есть?
   IvanGorbunov
 
7 - 28.12.18 - 15:17
(6) так оно платное
   IvanGorbunov
 
8 - 28.12.18 - 15:18
как я понял, гугл определяет, что это машина стучится, а не человек, а это нарушает правила использования сервиса
   Cyberhawk
 
9 - 28.12.18 - 15:26
Держи карман шире
   Fragster
 
10 - 28.12.18 - 15:29
 
 Рекламное место пустует
   IvanGorbunov
 
11 - 28.12.18 - 15:34
(10) спасибо, но слишком сразу не очевидно, нет столько времени, чтобы разбираться с таким вариантов
   Fragster
 
12 - 28.12.18 - 15:35
(11) сэкономишь больше времени. Запустить приложение вместо парсинга страницы, которая на js работает
   Garikk
 
13 - 28.12.18 - 15:43
(7) как бизьнес так норм счета выставлять, а как переводчик так "платное"
А может и 1С у вас ворованый?
:)
   sitex
 
14 - 28.12.18 - 16:00
(0) Есть подобное с использованием WinHttp.WinHttpRequest.5.1".

(8) Если ты про reкапчу то надо в куках взять GOOGLE_ABUSE_EXEMPTION=ID и передавать.
   novichok79
 
15 - 28.12.18 - 16:02
   novichok79
 
16 - 28.12.18 - 16:05
а оно денег хочет. понятно
   novichok79
 
17 - 28.12.18 - 16:07
»
   Вафель
 
18 - 28.12.18 - 16:15
зачем ты css сюда вывалил?
   Скиурус
 
19 - 28.12.18 - 16:29
Так просто для сведения, этот move вас хочет отмувить на https версию страницы. Чтобы сразу зайти на https нужно В HTTPСоединение установить Новый ЗащищенноеСоединениеOpenSSL(Новый СертификатКлиентаWindows(), Новый СертификатыУдостоверяющихЦентровWindows());
Но с гуглем так просто это не поможет, потому как слова "орех" вы в исходнике страницы не найдете - AJAX, однако
   sitex
 
20 - 28.12.18 - 16:45
Спец нашел в своем хламе, две старые версии translate.google.com, проверить какая из них рабочая.
1)Которая парсить html уже не рабочая.
2) Которая возвращает сразу результат перевод вроде еще живая (но ест-но без танцев не обошлось).
   novichok79
 
21 - 28.12.18 - 17:32
(18) соррян, не знал что оно будет настолько большим.
   xaozai
 
22 - 28.12.18 - 17:51
(0) А зачем вы через задний проход эту задачу решаете?
Есть же API.
https://cloud.google.com/translate/docs/
   xaozai
 
23 - 28.12.18 - 17:52
Уже готовое даже есть: http://catalog.mista.ru/public/128449/
   Вафель
 
24 - 28.12.18 - 17:56
так онож платное
   Генератор
 
25 - 28.12.18 - 18:27
тоже пытался через гугл, в итоге сделал через яндекс api
   Garikk
 
26 - 28.12.18 - 18:40
яндекс лучше гугла переводит... гугл лет 5 назад испохабил переаодчик до невозможности, он реально на основании поисковых запросов переводы делает


Список тем форума
Рекламное место пустует  Рекламное место пустует
ВНИМАНИЕ! Если вы потеряли окно ввода сообщения, нажмите Ctrl-F5 или Ctrl-R или кнопку "Обновить" в браузере.
Рекламное место пустует