SpaceLib

Новости Главная Введение Программы Загрузка Карта сайта

 

AllDocView.

 

AllDocView - программа предназначена для быстрой сортировки документов. Она использует установленные  у вас ActivX объекты для показа выбранных документов. Контейнером для таких объектов является Internet Explorer. Это значит, что для корректной работы AllDocView он должен быть установлен в системе. Такое решение позволяет сортировать любые документы, которое в состояние отображаться в вашем Internet Explorer-е.

 Под сортировкой я понимаю перенос документа в папку с осмысленным названием. Например: файл qt4.djvu будет перенесен в папку: «QT 4 программирование GUI на C++.  Жасмин Бланшет, Марк Саммерфилд». Полный же путь к файлу будет такой: «D:\библиотека\книги\QT 4 программирование GUI на C++.  Жасмин Бланшет Марк, Саммерфилд\qt4.djvu». Папку «D:\библиотека\книги» будем называть корневой папкой вашей библиотеки.

 

Т.к. не  все документы состоят из одного файла, такое решение будет оптимальным. По сути вся информация о документе хранится в файловой системе. В простейшем случае такое решение позволяет без всяких сторонних программ производить любые операции над такой библиотекой документов и без затруднений пользоваться ей из под любой   операционной системы, поддерживающей длинные имена файлов. Единственное ограничение это общая длина названия документа в месте с путем к нему. Такая длина не должна превышать 255 символов.

 

Настройки.

    Выберите  закладку: «Настройки (Options)». При первом запуске программы необходимо сделать некоторые настройки:

  1. Задать путь к «пойманным» документам («Папка с документами для просмотра»)
  2. Ввести расширения документов через точку с запятой, по умолчанию «*.pdf;*.djvu;» («Расширения документов которые будем просматривать»).
  3. Определить папку для «удаляемых» документов («Папка для удаляемых документов»).
  4. Задать «Корневые ПАПКИ вашей библиотеки». В простейшем случае это могут быть папки например: «D:\библиотека\книги», «D:\библиотека\журналы».

    Далее идут не обязательные настройки.

«Искать разделитель в имени файла» - включив эту опцию программа будет анализировать имена сортируемых файлов.  При переносе файла, найдя в его имени разделитель «_=», будет  откидывать левую часть имени, оставляя только правую. Например если у вас был файл с именем "519_d05c67**b9_77.221.132.218_6736574.pdf.rar_=HardnSoftPDF2007-08.pdf", то при переносе в новую папку этот файл получит новое имя «HardnSoftPDF2007-08.pdf», возможный полный путь будет: «D:\библиотека\журналы\Hard and Soft\ HardnSoftPDF2007-08.pdf». Напомню что разделитель в имени файла добавляет программа «ProcessingArchive». При автоматической распаковке архива с несколькими документами, такой «трюк» во время сортировки, позволяет сохранить порядок следовая разных частей документа друг  за другом. Кроме того документы загружаемые одним пользователем тоже группируются и при сортировке идут вместе. Желательно имена файлам при «ловле рыбки» давать по следующему шаблону: «name_format=*/p_m_s_c.E» (см. файл skynet.ini).

 «Порог добавления в список при не четком поиске в названиях книг от 0 до 1000» . По умолчанию 100. Не четкий поиск задумывался для нахождения наиболее близких названий книг по отношению к тестируемому. Однако работает он несколько «криво» и пока не очень интересен.

  «Файл для обмена закладками». При сортировке вы видите очень интересную книгу, но вам сейчас некогда ее смотреть и что бы не забыть о ее существовании можно установить на нее закладку. Далее этой закладкой можно будет воспользоваться в программе «SpaceLib» (Напомню, что «SpaceLib»  ведет базу данных вашей библиотеки документов).

 

Сортировка.

    Выберите  закладку: «Просмотр (View)». При сортировке используйте следующие основные комбинации клавиш:

1.      Shift и стрелка вправо – переход к следующему документу.

2.      Shift и стрелка влево – переход к предыдущему документу.

3.      Shift и Del – «удаление» документа, т.е. перенос его в папку для последующего физического удаления.

4.      Shift и «*» - вызывает окно переноса документа, в котором вы задаете имя папки куда будет помещен документ, кроме того, там же определяется:  текущая корневая папка библиотеки.

  Эти 4 клавиши будут «Глобальными», не только для данного приложения, но и для текущего рабочего сеанса «Windows». Не очень хорошее решение продиктовано необходимость управлять работой программы в не зависимости от того где сейчас находится «фокус» ввода, на ActivX объекте или контроллах нашей программы. ActivX объект это отдельная программа со своим фокусом ввода.

 

   Слева расположена панель с функциональными кнопками, которые дублируют «глобальные» клавиши и дополняют их некоторыми важными функциями. Рассмотрим их подробнее.

Скрыть или показать список файлов.

Перечитать папку  с файлами документов.

Перейти к следующему или вернуться к предыдущему документу.

Переход к документу по его номеру в списке.

Удалить документ.

Открыть окно "Новая книга".

Открыть окно "Новая книга" с текстом из буфера обмена.

Поле для приема текста по технологии «Взял и перетащил». Двойной щелчок на нем позволяет добавить текст из буфера обмена  справа к уже существующему в этом поле тексту.

Открыть окно "Новая книга" с текстом из поля приема текста.

Открыть текущий файл с помощью внешней программы, которая зарегистрирована в операционной системе. Файл открывается в отдельном окне.

Выход из программы.

 

Это  программа была написана после появления  у меня более мощного компьютера. Два ядра по 2.8 МГц позволяют «на лету»  создавать сложные изображения документов. Если у вас более слабая машина и вы чувствуете, что приходится ждать перерисовки страниц то советую обратиться к QViewFile. Обе программы исповедуют одну и туже стратегию сортировки. Вначале все пойманные файлы документов переносите в одну папку. Те файлы, которые находятся в архивах распаковывайте с помощью ProcessingArchive. Удаляйте дубли при помощи DelDubl. Среди файлов подготовленных для сортировки ищите и удаляйте те, которые уже находятся в вашей библиотеке, используя либо SpaceLib, либо FindNameDocs. FindNameDocs  в режиме поиска дублей относительно вашей библиотеки должен в качестве Базы идентификации использовать вашу уникальную базу идентификации, построенную на вашей библиотеке! Теперь после того, как удалены дубли и файлы которые уже есть в вашей библиотеке, вы можете приступать к автоматической сортировке. Запускайте последовательно ED2K_FNDocs и  FindNameDocs указывая им мою Базу идентификации. Найденные файлы будут помещены в папки с осмысленными названиями или переименованы. Это зависит от настроек. Если вы рыбачите там же где и я (спутник Ам22, провайдер PlanetaSky), то самые ценные книги и журналы с вероятностью 95% будут отсортированы в автоматическом  режиме, вам только останется решить нужны они вам или нет. А вот для всего остального, что осталось после автоматической сортировки  и написана эта программа.

   Процесс сортировки лучше разбить на два прохода. В первом вы удаляете все ненужное (Shift и стрелка вправо – переход к следующему документу, Shift и Del – «удаление» документа). Оцениваете объем оставленного к ручной сортировке материала. А уже  во втором проходе начинаете переносить файлы документов в папки  с осмысленными названиями, т.е. по сути создаете свою библиотеку документов. Перед вызовом диалога «Новая книга» я захватываю в буфер обмена название книги из документа, если он конечно же содержит текст, а не изображение текста. Далее я нажимаю клавишу «Открыть окно "Новая книга" с текстом из буфера обмена». Текст из буфера обмена попадает в поле «название  новой книги» и если оно вас устраивает, выбирайте корневую папку библиотеки (клавиши  от F1 до F7 зарезервированы для быстрого выбора из списка). Нажав Enter вы перенесете текущий файл в «новую папку» с названием из поля «название  новой книги».

 

   Как  я уже говорил не всегда документ содержит текст. Очень часто присутствуют только изображения страниц или  файл защищен. По этому я всегда стараюсь использовать «ABBYY Screenshot Reader». После того, как я с помощью мышки выделю прямоугольник  с текстом, «ABBYY Screenshot Reader» его распознает, поместит в буфер обмена и подаст звуковой сигнал. Теперь можно нажимать клавишу «Открыть окно "Новая книга" с текстом из буфера обмена». Дале выбирайте корневую папку и переносите файл в папку с именем из поля  «название  новой книги».

 

Диалог «Новая книга».

Назначение данного диалога понятно из названия. Остановимся на некоторых моментах подробнее. «Корневые папки» -  их лучше иметь в пределах 3-7 шт. (Оптимально: «Книги», «Журналы», «Статьи») Клавиша слева с двумя расходящимися стрелками вызывает диалог выбора корневых папок, если они не полностью помещаются на экране или горячих клавиш (от F1 до F7) не хватает. Среди корневых папок советую поместить ключевое слово «ALL». Это не папка это сигнал программе отсканировать все корневые папки, найти название ВСЕХ книг и поместить результат во внутренний буфер. Далее вы можете воспользоваться клавишами точного или не точного поиска. При «точном поиске» можно использовать логические выражения из ключевых слов в поле «Название новой книги». Регистр букв игнорируется. Перед ключевыми словами возможны следующие управляющие символы:

«+» - следующий фрагмент текста за знаком «плюс» должен быть обязательно в тестируемой строке. (Операция И).
«-» - следующий фрагмент текста за знаком «минус» на НЕ должен быть в тестируемой строке. (Операция НЕ).
«~» или «/»- если в поле сообщения найден будет фрагмент текста, следующий за знаками «тильда» или «косая черта», то такая строка будет обязательна включена в результат поиска. (Операция ИЛИ).
«_» - знак обозначает пробел.
«?» - знак маскировки символа. (Например, задав для поиска строку «б?й» будут найдены все строки в  которых, присутствует последовательность букв «б», «любой символ», «й». Под такую маску подпадают слова: буй, бай, бой, собой, байт и т.д.). Пример:  +процессор -кухонны ~интел ~амд . Знак «+» может быть опущен.

не четкий поиск названий книг

        При не четком поиске происходит попытка сравнить близких по написанию названий одной и той же книги. Создается рекомендательный список с рейтингом совпадений. Пока работа нечеткого поиска требует доработки.

  Если вы видите, что имя сортируемого файла содержит название книги используйте клавишу Alt-ф .

 Лучше давать названия документам не боле 200 символов. Т. к. максимальный полный путь к файлам обычно ограничивается 255 символами. Если вы превысите порог в 255 символов программа выдаст диалог и предложит скорректировать имя самого файла.

Закладка «Восстановление».

   Иногда по инерции можно нажать «удалить документ». Как я уже говорил документы не удаляются а переносятся  в специальную папку заданную вами. Например: «D:\delete». Это позволяет легко вернуть документ на место. Двигая курсором по списку удалений вы видите в низу два поля «Откуда - Из» и «Куда - В». Если файл находится по указанному полному пути он  подсвечивается зеленым цветом, иначе красным. Кнопка «Восстановление» позволяет перенести документ из «Куда» в «Откуда».

 

Дополнительные замечания.

   Хочется обратить внимание на папку «D:\delete» ее содержимое может быть очень ценным. Для это перед физическим удалением документов из этой папки поместите их в папку «D:\delete\удалять сразу», далее с помощью программы FindNameDocs выгрузите ее содержимое в файл базы идентификации «Удаленные_ранее_0.txt» (закладка  «экспорт в файл»). В дальнейшем чтобы использовать полученную информацию о ранее просмотренных и удаленных за ненадобностью файлах переносите содержание файла «Удаленные_ранее_0.txt» в файл «Удаленные_ранее.txt» путем его добавления. Можно использовать командную строку

   «copy Удаленные_ранее.txt+Удаленные_ранее_0.txt  Удаленные_ранее.txt»

На закладке «Поиск» добавьте к Базам идентификации еще и файл «Удаленные_ранее.txt». После поиска среди вновь «пойманных» файлов, возможно найдутся те файлы, которые вы ранее уже удаляли,   они будут перенесены в папку «удалять сразу».

   Внимание с 13.02.08 к AllDocView, "прикрутил"  базу книг ОЗОНА. Теперь распознав ISBN через ABBYY Screenshot Reader, можно сразу  искать название книги в базе (новая кнопка "лупа"). Всего в базе  ОЗОНА более 312000 записей. Сей метод уверенно работает на новых книжках 2006-2008г. издания. Базу озона надо предварительно загрузить у меня и прописать на странице-закладке "ISBN". При каждом старте программы заходите на страницу и жмите кнопку "загрузить". По этой базе можно так же искать книги, используя выражения поиска так же, как и в диалоге «Новая книга».
   
Диалог «Новая книга» можно сделать полупрозрачным, что бы видеть текст документа через него.


 

   Введена новая кнопка "Т+"  она добавляет текст к "полю приема текста". Она удобна когда за один раз не получается распознать  или выделить название книги и автора. В этом случае жмите на кнопку каждый раз после появления текста в буфере обмена.

  Кнопка будет доступна, когда у текущего документа есть файл сателит *.NameBook. В этом файле хранятся уже найденные  с помощью программы FindISBN названия книги. Программа FindISBN ищет названия по ISBN в локальной базе, сделанной из книжной базы Озона или обращаясь к  онлайновым сервисам. Подробнее...

К началу.

Паламарь Игорь 2007-2008г.

 
Новости Главная

Введение

Программы

Загрузка Карта сайта
Hosted by uCoz