Скачивалка с самарского архива

Несколько читателей сообщили, что моя скачивалка архивов ЭлАра не работает — самарский архив что-то у себя изменил и она перестала работать.

Вчера мне понадобились документы оттуда, поэтому я её немного подпилил под новые реалии. Разрешение файлов пришлось убавить, но лично мне это дискомфорта не доставляет, а скачивается намного быстрее. В общем, новая версия лежит там же.

Чтобы вытащить из страницы список картинок, которые нужно качать, можно воспользоваться следующим способом: открываем консоль браузера и пишем туда следующее:
console.log("dxo.itemsValue=['"+
window['MainPlaceHolder__storageViewerControl__storageFilesViewerControl_FilesDropDownList_DDD_L'].
itemsValue.join("','")+"'];")
Вывод нужно скопировать в файл и натравить на него скачиватель. Параметры остались неизменными.
19 декабря 2013 12:42

Евгений (инкогнито)
20 декабря 2013, 06:38

Добрый день! Подскажите пожалуйста все сделал как у вас написано, но в консоли выводы не появляются

Новый рисунок (1).bmphttp://fotki.yandex.ru/users/jon2186/view/866948/?page=0

Евгений Степанищев (bolknote.ru)
20 декабря 2013, 06:47, ответ предназначен Евгению

Я сейчас попробовал в Хроме (31-я версия) — всё получилось. Попробуйте Хром.

Евгений (инкогнито)
20 декабря 2013, 12:28

Попробовал в Хроме та же ошибка: TypeError: Cannot read property 'itemsValue' of undefined
может что то в Хроме настраивать надо.

Евгений Степанищев (bolknote.ru)
20 декабря 2013, 12:42, ответ предназначен Евгению

Нет, ничего не надо. Возможно какая-то часть сайта работает иначе. Можно попробовать сделать по прежней инструкции: http://bolknote.ru/2013/04/09/~3937/

Евгений (инкогнито)
21 декабря 2013, 07:00

А что из себя должен представлять вывод и как его сохранить в файл кого формата должен быть файл.

Евгений Степанищев (bolknote.ru)
21 декабря 2013, 08:51, ответ предназначен Евгению

По ссылке написано.

Евгений (инкогнито)
21 декабря 2013, 11:29

Пробовал старым способом программа не работает. Скачивает 9 пустых JPGов. Тоже самое и с Тобольским архивом. Попробовал на архиве Югры http://31.163.202.181:8089/ все работает прчем и старая версия и новая. Может что то с располежением данных.

Евгений Степанищев (bolknote.ru)
21 декабря 2013, 14:26, ответ предназначен Евгению

Нет, так нет. Пока всё что нужно мне — качает. Наткнусь на то, что не качает — доделаю.

Сергей Андреев (инкогнито)
23 декабря 2013, 09:23, ответ предназначен Евгений Степанищев (bolknote.ru):

31-й хром, в консоли выдает запись типа dxo.itemsValue=['f952ebf0-0a55-4120-836b-88646a96f447',.. - судя по числу значений, совпадающему с числом страниц - все верно. Сохраняю результат в пустой txt, подсовываю его программе, но получаю "Error: <to> cannot be less than <from>" хотя не указывал ни того, ни другого. Где у меня косяк?

Евгений (инкогнито)
23 декабря 2013, 12:52, ответ предназначен Сергею Андрееву

Добрый день Сергей. Скажите у Вас операционная система "мак" или "виндоус". У меня на "виндоус" выдает ошибку: TypeError: Cannot read property 'itemsValue' of undefined. Может я что то не правильно делаю.

Евгений Степанищев (bolknote.ru)
23 декабря 2013, 15:31, ответ предназначен Сергею Андрееву

Да, моя ошибка, сейчас пост поправлю. В конец файла допишите ещё точку с запятой, будет работать.

Евгений Степанищев (bolknote.ru)
23 декабря 2013, 15:32, ответ предназначен Евгению

У меня — Мак. В общем, вам надо внутри страницы найти dxo.itemsValue, а внутри массив, где записано много таких значений как у Сергея Андреева выше.

Ку (инкогнито)
23 декабря 2013, 20:34

И правда всё поехало! Спасибо!

Ку (инкогнито)
23 декабря 2013, 20:48

Поехало-то поехало быстро, только картинки крошечные по сравнению с тем, что было, фиг разберешь что. Евгений, а нельзя ли увеличить размер "как було" или регулировать его как-то?

Ку (инкогнито)
23 декабря 2013, 21:01

На все, про все - 16 пикселей. И что здесь разобрать?

шохинhttp://fotki.yandex.ru/users/rcdc/view/827341?page=0

Евгений Степанищев (bolknote.ru)
23 декабря 2013, 21:03, ответ предназначен Ку

Попробую увеличить, когда в следующий раз пользоваться буду. Вообще ширина там 1024 пикселя должна быть. Возможно без склейки шире никак, если это так, то надо дописывать код, а это уже не работа на 15 минут.

Евгений Степанищев (bolknote.ru)
23 декабря 2013, 21:08, ответ предназначен Ку

Строку №17 в программе замените на

const url = `http://%s/Pages/ImageFile.ashx?level=11&x=0&y=0&tileOverlap=2048&id=%s&page=0&XHDOC=&archiveId=1`

и будет вам счастье :)

Евгений Степанищев (bolknote.ru)
23 декабря 2013, 21:09, ответ предназначен Ку

Чёрт, ссылка автоподставилась. В общем, в строке №17 надо level сделать 11, а tileOverlap — 2048. Будет в два раза больше.

Сергей Андреев (инкогнито)
24 декабря 2013, 11:41, ответ предназначен Евгений Степанищев (bolknote.ru):

Премного благодарен.

Сергей Андреев (инкогнито)
24 декабря 2013, 11:43, ответ предназначен Евгению

Евгений, Win 7, Chrome 31, причем с кучей плагинов и дополнений. Все работает.

Сергей Андреев (инкогнито)
24 декабря 2013, 13:58

Попробовал для интересу level 12, а tileOverlap — 4048 - качает, как и раньше страницы по 6-7 мегабайт высокого разрешения.

Евгений (инкогнито)
24 декабря 2013, 15:47, ответ предназначен Евгений Степанищев (bolknote.ru):

Спасибо, все заработало. К сожалению данный способ не подходит для Тобольского архива. Большая просьба Евгений к Вам, если у Вас появиться время может глянете что там с тобольским архивом. Может что интересненькое для себя найдете.

Евгений Степанищев (bolknote.ru)
24 декабря 2013, 18:42, ответ предназначен Евгению

В тобольский вряд ли — там пока не нашлась родня, но вдруг, мало ли :)

Евгений (инкогнито)
25 декабря 2013, 06:33

Огромное вам спасибо. Благодаря вашему идее я все таки нашел способ как скачивать с Тобольского архива. Принцип тот же.

Ку (инкогнито)
25 декабря 2013, 22:36

Евгений, получилось божественно! Даже размерчик менять можно, просто сказка!

Григорий (инкогнито)
27 декабря 2013, 08:13

Работает но не со всеми делами. Пишет Error: <to> cannot be less than <from> когда используется txt, и скачивается 6-7 файлов jpg если htm.
Даже закрытые еще месяц назад качает, а сегодня открытые 7 дел ни одно не осилил скрипт(((

Евгений Степанищев (bolknote.ru)
27 декабря 2013, 14:53, ответ предназначен Григорию

Возьмите новую версию. Там выше писали то же самое, посмотрите.

Григорий (инкогнито)
28 декабря 2013, 20:45, ответ предназначен Евгений Степанищев (bolknote.ru):

Неет! Скрипт измененный! Вот для примера ф32оп28 дело 178 качается, а 176 нет; дело 47 качается, а 4 нет...ф32оп38 дела 541,1038,1040,1041,1042а,1043, 1044, 1045, 1152 из htm качаются, а вот заказанные 7 дел с 1099 по 1106 увы никаким способом.

Евгений Степанищев (bolknote.ru)
29 декабря 2013, 10:28, ответ предназначен Григорию

Ну ок. Не качает, так не качает.

Сергей Андреев (инкогнито)
10 января 2014, 12:52

Замечу, что Error: <to> cannot be less than <from> можно убрать проверив нет ли лишних пробелов в конце файлика с содержимым dxo.itemsValuе - последним знаком там должно быть ;

Григорий (инкогнито)
10 января 2014, 23:03, ответ предназначен Сергею Андрееву

Твою ж налево! И вправду... Спасибо

Андрей (инкогнито)
4 сентября 2014, 18:12

Евгений, доброе время суток!

Не проверите, вроде бы ЭЛАР снова что-то поменял. Неделю назад - работало, сейчас нет. Опытным путем установлено, что в результате работы скачивалки скачивается XML файл с сообщением об ошибке размером около 17Кб. Установлено, также, что http://cgaso.regsamarh.ru/Pages/ImageFile.ashx?level=12&x=0&y=0&tileSize=256&tileOverlap=4096&id=<ID>&page=0&rotation=0 - работает, напрямую загружает, что видно через консоль JS. Однако, <ID>, который загружает картинку через браузер отличается от того, что сохраняется в dxo.ItemsValues, получаемое через consol.log. По внешнему виду в dxo.ItemsValues строка с двумя == на конце, что очень похоже на base64, но, мои попытки использовать encode/decode не увенчались успехом, т.е. строки все равно не соответствуют тому, что должно быть в ID. JS совершенно не мой конек, не могу найти скрипт который запрашивает. В JS console идет ссылка на seaddragon.js но я не вижу там ничего нужного.

По прямой ссылке скачивается и в другом браузере, где в АИС не авторизован, т.е. куки, авторизация - не при чем.

P.S. перезагрузки не помогли :)

Заранее благодарю.

Евгений Степанищев (bolknote.ru)
4 сентября 2014, 20:46, ответ предназначен Андрею

К сожалению, не смогу помочь, у меня доступ заблокировали — оказывается он на год выдаётся. И я уже три месяца не могу его восстановить — три раза отсылал заявление заново (через Госуслуги), недавно статус сменился на «рассмотрено», но доступа так и нет.

Андрей (инкогнито)
4 сентября 2014, 22:32, ответ предназначен Евгений Степанищев (bolknote.ru):

Через госулуги Самары именно (https://pgu.samregion.ru/rpguWeb/metro/newIndex.jsp)? Потом входили через "Вход через gosuslugi.ru"?

Евгений Степанищев (bolknote.ru)
5 сентября 2014, 08:10, ответ предназначен Андрею

Да, именно оттуда. Я тут обнаружил, что мой запрос почему-то называется «Информационное обслуживание пользователей в читальных залах государственных архивов Самарской области». Думаю, электронный архив читальным залом не считается. Значит надо подавать другое заявление и ждать ещё месяц.

Андрей (инкогнито)
5 сентября 2014, 10:28, ответ предназначен Евгений Степанищев (bolknote.ru):

Это оно и есть. Может данные не все указали? Через неделю после отправки повторной заявки попробуйте зайти в ЦГАСО. На Госуслушах статус может быть тем же, а доступ открывают. Еще вариант, что проще, на вгд напишите aradchenko из ЭЛАРа.

Ку (инкогнито)
5 сентября 2014, 19:48

А почему месяц?? Они все делают за 1-2 дня. Если заклинило, напишите о наболевшем Метелева Ольга <meteleva@regsamarh.ru> (Управление государственной архивной службы Самарской области).
Это мы типа очень ждем, что Вы расколдуете программулину

Евгений Степанищев (bolknote.ru)
6 сентября 2014, 11:14, ответ предназначен Ку

Спасибо! Попробую.

Григорий (инкогнито)
7 сентября 2014, 16:02

со старыми тхт все норм, а с новыми засада

Евгений Степанищев (bolknote.ru)
8 сентября 2014, 06:39, ответ предназначен Ку

Написал сегодня Ольге письмо, посмотрим что ответит.

Евгений Степанищев (bolknote.ru)
8 сентября 2014, 10:19

Ответила, разобрались, пустило. Как только появится время, начну разбираться!

Андрей (инкогнито)
20 октября 2014, 08:56, ответ предназначен Евгений Степанищев (bolknote.ru):

Евгений, здравствуйте! Не нашлось у Вас времечка поправить программку? Спасибо.

Евгений Степанищев (bolknote.ru)
20 октября 2014, 11:04, ответ предназначен Андрею

Здравствуйте!

Увы, нет. Я на время остался без ноутбука (пролил чай), так что пока не могу даже посмотреть, к сожалению.

Ку (инкогнито)
12 декабря 2014, 23:02

Андрей, как там Ваш ноутбук? Мы типа, затаив дыхание, очень ждем, что Вы расколдуете программулину

bolknote.ru (bolknote.ru)
13 декабря 2014, 09:42, ответ предназначен Ку

Меня зовут не Андрей. А программа «расколдована», я об этом ещё в октябре написал: http://bolknote.ru/2014/10/27/~4225

Ваше имя или адрес блога (можно OpenID):

Текст вашего комментария, не HTML:

Кому бы вы хотели ответить (или кликните на его аватару)