Вход | Регистрация
 

1С ЧтениеHTML получить заголовок страницы

1С ЧтениеHTML получить заголовок страницы
Я
   Maniac
 
05.07.19 - 18:51
Есть куча ссылок. нуно по ссылкам получить по каждой заголовок страницы. и чтобы это работало быстро
 
 
   dubolom
 
1 - 05.07.19 - 18:53
Если заголовок в буквальном смысле, то читай по тэгу title и будет тебе счастье.
   Maniac
 
2 - 05.07.19 - 19:04
Чота не работает вообще

Если ЗначениеЗаполнено(АдресСтраницы) И Найти(АдресСтраницы,"http") > 0 Тогда
Соединение = Новый HTTPСоединение(АдресСайта);
Запрос = Новый HTTPЗапрос(АдресСтраницы);
Ответ = Соединение.Получить(Запрос);
Если Ответ.КодСостояния = 200 Тогда 
Значение = Ответ.Заголовки;
КонецЕсли; 
КонецЕсли;
   Maniac
 
3 - 05.07.19 - 19:06
и очень долго. 60 строк 3 минуты
   Maniac
 
4 - 05.07.19 - 19:10
ошибок не выдает. но и ничего не возвращает. и долго
   Garykom
 
5 - 05.07.19 - 19:16
А если заголовок меняется через JS ?
   Maniac
 
6 - 05.07.19 - 19:24
короче соединения работают. возвраты есть. но работает все пипец как долго.
видимо читает каждую страницу целиком... а нужно только заголовки.
   dubolom
 
7 - 05.07.19 - 19:25
(6) Как ты себе представляешь чтение только заголовка?
   Maniac
 
8 - 05.07.19 - 19:31
(7) да также как например 1С умеет заголовки писем почты читать
   Maniac
 
9 - 05.07.19 - 19:32
я думал это возможно..
   dubolom
 
10 - 05.07.19 - 19:36
(9) У письма почты заголовок - отдельное поле. Он так и хранится.
А из кода страницы тебе надо его самостоятельно выковыривать. Никто заранее не скажет, где он там.
   Garykom
 
11 - 05.07.19 - 19:37
Мне интереснее зачем нужны заголовки страницы и не путаем ли с HTTP Headers ))
   Garykom
 
12 - 05.07.19 - 19:39
Title из head из body хрен получишь правильный полностью не загрузив страницу и не дав отработать javascript коду.

А вот Headers можно отдельно от тела прочитать.
   Maniac
 
13 - 05.07.19 - 19:40
(11) а как его в 1С получить?
   Garykom
 
14 - 05.07.19 - 19:44
(13) Ты объясни науйя?
   Maniac
 
15 - 05.07.19 - 19:45
на каждо странице товар. заголовок страницы наименование товара. тупо наименования получить вместо ссылок
   Garykom
 
16 - 05.07.19 - 19:46
(15) Проанализируй как страницы строятся, может есть некий api который можно заюзать и получить готовые данные в json.
   Garykom
 
17 - 05.07.19 - 19:48
(16) Но если там PHP без JS то облом конечно и страницы на сервере формируются.

В общем случае пиши многопоточный браузер и использую его.
   Maniac
 
18 - 05.07.19 - 19:50
да зараза там именно PHP
   Maniac
 
19 - 05.07.19 - 19:53
/index.phpproductID=3803
/index.phpproductID=3771
/index.phpproductID=5678
/index.phpproductID=5677
/index.phpproductID=3783
   dubolom
 
20 - 05.07.19 - 20:13
(18) Нельзя как-нибудь договориться, чтобы данные присылались в более удобном виде?
   Maniac
 
21 - 05.07.19 - 20:17
(20) почти никто не меняет свои кривые прайсы. многократно об этом говорю клиентам.

Ладно решили сделать чтобы чтение возвращало текст ячеек и ссылку одновременно. буду разбирать текстовую строку
   Maniac
 
22 - 05.07.19 - 20:18
хотя парсинг страниц тоже тема нужная.
   Garykom
 
23 - 05.07.19 - 20:38
(22) Парсинг страниц уже давно освоенная тема и куча решений есть как платных так и бесплатных.
В 1С остается только готовые данные загружать из файлов текстовых или табличных или из базы.
   Maniac
 
24 - 05.07.19 - 23:35
(23) давно не давно есть - а все с костылями!
   Maniac
 
25 - 05.07.19 - 23:36
каждый новый случай какой то уникальный
   Maniac
 
26 - 05.07.19 - 23:36
то что есть не более чем привые примеры которые еще напильником пилить и пилить


Список тем форума
Рекламное место пустует  Рекламное место пустует
ВНИМАНИЕ! Если вы потеряли окно ввода сообщения, нажмите Ctrl-F5 или Ctrl-R или кнопку "Обновить" в браузере.