SpaceLib

Новости Главная Введение Программы Загрузка Карта сайта

 

FindNameDocs 

 Программа FindNameDocs  предназначена для идентификации файлов. Основное применение – автоматическая сортировка «улова» пойманного с помощью таких программ как skynet, SkyGarber, DataSky, Manna и др. Для идентификации файлов используется связка (ДЛИНА ФАЙЛА + КОНТРОЛЬНАЯ СУММА ФАЙЛА). Сортировка происходит путем переноса идентифицированных файлов в папки с именами взятым из базы идентификации или путем изменения имени файла на новое. База данных идентификации это простой текстовый файл, в котором хранится информация о ранее идентифицированных файлах. Формат данного текстового файла следующий:

 // CRC32-контрольная сумма файла документа длиной 11 символов ; размер  файла документа в байтах длиной 12 символов ; имя документа до конца строки.

  Пример:

  04227227224;000006445232;ИСКУССТВО ПРОГРАММИРОВАНИЯ.  КНУТ

  04235570299;000003018508;СИСТЕМНЫЙ АДМИНИСТРАТОР

  04273634548;000004054888;ADVANCED SIGNAL PROCESSING HANDBOOK

  CRC32 и длина файла хранятся в символьном виде и слева до своего размера заполняются символом 0.

  Для автоматической сортировки выберите закладку «ПОИСК». На ней задайте путь к файлам, которые хотите идентифицировать. Например: D:\skynet\ok у каждого он будет своим. Укажите файл(ы) Базы идентификации (например у меня он: D:\prg\FindDocs\вся_библиотека.txt). Выбираем папку, куда будем переносить идентифицированные файлы, далее модель сортировки. Я рекомендую значение по умолчанию, т.е. переносить файлы в отдельные папки - имена которых взяты из Базы идентификации. Если выбран CheckBox  «Диалог при повторе Crc32+Size» ,то когда  в Базе существуют несколько названий документа для одного и того же файла, то во время работы программы будет появляться диалог предлагающий выбрать с вашей точки зрения лучшее название.

  Закладка «Экспорт в файл» предназначена для тех, кто хочет поделиться с другими своими результатами РУЧНОЙ  сортировки файлов. Допустим, с помощью этой программы вы смогли в автоматическом режиме отсортировать часть файлов. Но у вас остались еще файлы, информации о которых нет в Базе идентификации. И вы как обычно запускаете программу просмотра данных файлов. Те которые вам нужны, вы сохраните в папку с осмысленным названием, например: файлик размером 11 249 536 байт  и именем 7000_d05c0*****_209.123.181.125_196856.rar вы перенесли в папку «V:\Софт_со_спутника\SkyNet_MonsterPack. 13 софт для рыбалки». Здесь, как вы понимаете осмысленное название, которое сохранится  в базе будет «SkyNet_MonsterPack.13 софт для рыбалки», а «V:\Софт_со_спутника\» это КОРНЕВАЯ папка вашей библиотеки, таких папок может быть много. Например, у меня они такие:

    s:\библиотека\ журналы

    s:\библиотека\ книги

 Для Экспорта, вы задаете эти корневые папки и имя файла куда выгружаете данные. Например: D:\prg\FindDocs\вся_библиотека.txt. Все, уже можно нажимать кнопку «Начать выгрузку». Информация  о  ВСЕХ файлах будет записана  в файл вся_библиотека.txt.  Если вы хотите выгружать только файлы, отсортированные вами, то в окошке «Файлы с инф. о ранее выгруженных документах (файлах) библиотеки» укажите имя(имена) файла(файлов) Базы идентификации, где хранится информации о файлах, которые не будут включаться в выгрузку. Полученный текстовый файл надо архивировать и слать мне на мыло (spacelib собака narod.ru). По мере накопления таких файлов я их буду объединять и выкладывать в виде добавок к основной базе, а потом и включать в нее.

  Хочу обратить внимание на CheckBox  «Диалог при повторе Crc32+Size». Появление этого диалога мера вынужденная , т.к. в общем случае компьютер не человек и оценить какое имя для файла лучше из двух и более возможных не может. В идеале в выверенной Базе идентификации таких дублей быть не должно, но в жизни все иначе.

 

  Программа FindNameDocs поставляется с исходными кодами. Это значит, что  вы можете их использовать без ограничений, в том случае, если не меняете формат Базы идентификации и обязуетесь ее распространять (Базу) бесплатно и без дополнительных условий. Я не претендую на единоличное ведение Базы идентификации. Если найдется кто-то, кто захочет это делать безвозмездно, с радостью с этим соглашусь.

Страница загрузки...

Новости Главная

Введение

Программы

Загрузка Карта сайта
Hosted by uCoz