Форум портала

Форум портала "Архивы России" (http://forum.rusarchives.ru/index.php)
-   Архивные документы в Сети (http://forum.rusarchives.ru/forumdisplay.php?f=38)
-   -   Проект по метрическим книгам, возобновление работ (http://forum.rusarchives.ru/showthread.php?t=5801)

KommE 31.12.2013 22:21

:) А давайте загадаем на Новый 2014 год! Чтобы Елена, как бы трудно не было на первом этапе, все-таки дала в открытый доступ инструмент, позволяющий быть свободным от монополиста/ов.

С Новым годом! С новым доступом! :)

Елена Суслова 09.01.2014 09:57

Здравствуйте, уважаемые! Приветствую в новом году и желаю всем успехов во всех начинаниях!
Большое спасибо за поддержку и неравнодушие.
Пока коротко о том, что удалось сделать. Проект сейчас находится в Интернете на тестовой площадке.
Поиск по Делам, по населенным пунктам, по годам реализован. Все дела упорядочены и проверены на повторы, просматриваются в электронном виде, сейчас в БД все дела с МК, поэтому виден общий объем и объем отсканированных дел.
Пока выверяются повторы в МК. После проверки будет возможность поиска по метрическим книгам и персонам.
Спасибо тем, кто предлагает помощь по наполнению БД, откликаются те, кто раньше занимались наполнением, там и генеалоги есть тоже.
Надеюсь, что в течение месяца получится выявить большие ошибки и показать результаты.

Елена Суслова 21.01.2014 08:24

Здравствуйте! Как бы ни хотелось поскорее представить результаты работы, но... Чем дальше в "лес", тем круче проблемы. Решаем ребусы, выстраиваем логические цепочки, чтобы распутать хоть что-то.
Скорее всего МК придется индексировать заново... т.е. выявлять из Дел страницы относящиеся к определенным МК. Пришлось писать программу, чтобы понять откуда берется такое большое количество повторных записей МК. В итоге пришли к выводу, что неадекватный оператор(ы) сканирующий или описывающий МК очень часто ошибался в проставлении года.. если он писал год отличный от предыдущей записи, то автоматом создавалась новая запись (с 2-3 стр. и неверным годом), потом год возвращался верный и вновь появлялись записи с продолжением страниц... это наверно сложно представить, но автоматические такие ошибки выявить проблематично, поэтому проще сделать заново. Оператор мог ошибиться по 10 раз при описании одной книги (выявлено точно), собрать все это по листочкам тяжело.
Если кто-то хочет убедиться, найдите "Метрическая книга о рождении, о браке, о смерти. С. Богородец, Богородская церковь Осинского уезда за 1897 год", книга одна, а на проекте 11 записей.

Елена Суслова 21.01.2014 14:59

Работа над страницами. Проведена также программная проверка, которая выявила 2 типичные ошибки - ошибка в имени файла (нет разделяющей точки после номера описи), поэтому некоторые изображения не открываются, таких не мало, наверно замечали, те кто работают с базой. Это исправляется автоматически.
2-я - несоответствие шифра и файла страницы (разные описи), поэтому пользователи могут, работая с одним делом, получить картинку совсем другого. Это тоже исправим автоматом, но только после проверки.
Есть еще повторные страницы... их пока в отдельную таблицу будем складывать.

Елена Суслова 21.01.2014 15:05

Есть вопрос: нужно ли МК разбить на закладки или части по рождению, браку и смерти? Т.е. когда откроется карточка МК, то можно сразу перейти к разделу о смерти, например...

IvanS 22.01.2014 17:29

Думаю, такая возможность лишней не будет.

У вас предусмотрено разделение и по церквям - в случае, если в одном деле собраны метрики из разных церквей?

Елена Суслова 23.01.2014 07:51

У МК есть поля - губерния, уезд, нас. пункт, название храма, конфессия, год.

aradchenko 12.03.2014 20:27

2 месяца прошло от последнего поста. Неужели все так и заглохло?

Елена Суслова 14.03.2014 08:34

Нет, не заглохло. Ответ мой вряд ли Вам понравится.
То, что имеется сейчас в базе использовать на уровне метрических книг невозможно. Масса записей без прикрепленных изображений, много ошибок в названиях файлов. Одна метрическая книга может быть разбита на много фрагментов, которые еще и дублируются, вообщем одна большая каша. Написана программа, она что-то смогла автоматически отбросить, сейчас индексируем собственными силами метрические книги заново, по мере возможности, без дополнительного финансирования.
На уровне Дел и Персон поиск и фильтры переработаны, все функционирует. Как разберемся с Метрическими книгами, так и выложим на старый ресурс.
Вообще, не понятно, как можно было принять такую работу, где косяки именно разработчиков, а не тех, кто наполнял базу видны невооруженным глазом, не говорите только, что Вы их не видите и не знали о них раньше. Я видела и на форуме на самом сайте проекта и на Терроне сообщения об этих ошибках и безответную реакцию техподдержки. Почему не исправлялись они я теперь могу понять, потому что их не исправить, а переделывать заново надо было.

aradchenko 14.03.2014 09:18

Цитата:

Сообщение от Елена Суслова (Сообщение 15996)
Нет, не заглохло. Ответ мой вряд ли Вам понравится.
То, что имеется сейчас в базе использовать на уровне метрических книг невозможно. Масса записей без прикрепленных изображений, много ошибок в названиях файлов. Одна метрическая книга может быть разбита на много фрагментов, которые еще и дублируются, вообщем одна большая каша. Написана программа, она что-то смогла автоматически отбросить, сейчас индексируем собственными силами метрические книги заново, по мере возможности, без дополнительного финансирования.
На уровне Дел и Персон поиск и фильтры переработаны, все функционирует. Как разберемся с Метрическими книгами, так и выложим на старый ресурс.
Вообще, не понятно, как можно было принять такую работу, где косяки именно разработчиков, а не тех, кто наполнял базу видны невооруженным глазом, не говорите только, что Вы их не видите и не знали о них раньше. Я видела и на форуме на самом сайте проекта и на Терроне сообщения об этих ошибках и безответную реакцию техподдержки. Почему не исправлялись они я теперь могу понять, потому что их не исправить, а переделывать заново надо было.

Елена!
То что Вы на энтузиазме пытаетесь сделать новый ресурс-это достойно. Однако, прежде чем ругать нас, хочу напомнить, что все упомянутые Вми ошибки полезли после того, как мы передали и ПО сайта и контент Цукановой А. Архив пытался неоднократно самостоятельно развернуть сайт, а так же с помощью спецов из Правительства, но ничего не вышло Развернуть ПО сайта мы помогли, а вот загрузку ресурса архив делал самостоятельно. Результат этой загрузки на целостность и дублетность мы не проверяли. Нас и не просили. Что в итоге получилось, то и есть. А по поводу ошибок индексирования, которых избежать очень сложно, я , при встрече расскажу, откуда они. Не буду забивать эфир технологическими подробностями. Тем не менее, мне интересно-Вы будете новое ПО сайта писать или попытаетесь БД с новой структурой воткнуть в старое ПО? Мне представлялось, судя по Вашему прежнему настрою, что появится абсолютно новый продукт. Или я неправ?


Часовой пояс GMT +4, время: 12:03.

Powered by vBulletin® Version 3.8.6
Copyright ©2000 - 2021, Jelsoft Enterprises Ltd. Перевод: zCarot
© Портал "Архивы России", 2008-2015