Скрипты для LIB-4 (MW)

Скрипты для LIB-4 (MW)
Тут буду выкладывать некоторые скрипты, которые были использованы при подготовке Библиотеки 4 версии (LIB-4) на движке MediaWiki

Скрипты написаны на AutoIt
Писаны для себя и под свои узкие нужды, поэтому не обессудьте.
Была ли полезна информация?
230 байт

Ранее в Битрикс-Вики возникла проблема с длинными именами файлов, которые к тому-же в кириллице были (2 байта на символ). Битрикс кириллицу не пропускал (на тот момент) поэтому Сергей перегнал их в латиницу (1 байт на символ) и проблема автоматически практически решилась, а что не лезло он вручную отрезал. И мы забыли.

В МедиаВики проблема всплыла с новой остротой, с учетом путей – 240 байт и не более, что для кириллицы – около 120 знаков и мы с Федей несколько дней угробили пока вкурили, что ограничение файловой системы не обойти нам никак.
Резать по живому было жалко, поэтому пришлось резать боль-мень интеллектуально, считая каждый байт. Кроме того авторов тоже сохранил, они очень пригодятся семантическим расширениям и поиску ранга "найти похожее".

Этот пример пишет результаты в файл, в удобном для просмотра формате. После просмотра вставлю переименование и все. В свойствах файла оригинальное имя (длинное) останется (там другой скрипт отработал). Если получится, в теле статьи MW оригинальное (длинное) имя будет выдергиваться из свойств расширением и подставляться в тело статьи шаблоном.

Скрипт и результат его работы по Библиотеке и по гостам
Была ли полезна информация?
Скрипт для пакетного распознавания djvu и сохранения в djvu+ocr
Была ли полезна информация?
результат работы скрипта dlina bait.au3 для нормативки
длина имени файла < 230 байт

зафиксировано до следующей версии - 2979 файлов
ручная проверка дублей не проводилась
можно брать за эталон
Была ли полезна информация?
Читают тему (гостей: 1)