Главная
страница 1страница 2страница 3

ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ СОЗДАНИЯ ПОЛНОТЕКСТОВЫХ КОЛЛЕКЦИЙ (ЭЛЕКТРОННЫХ БИБЛИОТЕК) ГРИНСТОУН

(GreenStone)
Учебно-справочное

пособие для библиотечных работников



Содержание


Предисловие…...…..…………………………………3


  1. Программное обеспечение Гринстоун……….. 7

1.1. Гринстоун: история создания…………....7

1.2. Гринстоун: назначение и задачи………..15

1.3. Гринстоун: основные характеристики….16

1.4. Установка версии 2.70 под Windows…...21

1.5. Первый запуск……………………………24

1.6. Создаем первую коллекцию…………….25


2. Гринстоун: чуть подробнее……………………35

3. Примеры коллекций……………………………47

3.1. Примеры локальных коллекций……….47

3.2. Примеры сетевых коллекций…………...48


Заключение..................................................................54
Использованная
и рекомендуемая литература ……………...…......55
Ссылки……………………………………………….56

Предисловие



kia hora te marino,
kia tere te karohirohi,
kia papapounamu te moana


Пусть вас окружают мир и спокойствие,

Пусть постоянно вы будете находиться в теплых объятиях лета,
Пусть воды океана ваших путешествий будут столь же гладкими,


Как отполированные грани Гринстоун.
Ни для кого не секрет, что библиотеки переживают сейчас не лучшие времена. Популярность электронных ресурсов и использования Интернет в качестве информационного источника приводят к снижению посещаемости библиотек. Библиотекам приходится конкурировать в поиске информации с такими «гигантами» как Google, Yandex, Yahoo и др. Не выходя из дома, любой желающий может без труда найти необходимую информацию на многочисленных веб-сайтах, в базах данных или электронных библиотеках в Интернет. Несмотря на то, что подобная информация зачастую является сомнительного качества, пользователи предпочитают подобный, менее затратный по времени, вид поиска, чем посещение ближайшей библиотеки.

Что же библиотеки могут предпринять, чтобы изменить ситуацию и привлечь читателей? Среди наиболее действенных мер – улучшение собственного электронного фонда, начиная с электронного каталога и веб-сайта, до предоставления доступа к качественным электронным ресурсам, которыми можно пользоваться не только в библиотеке, но и через Интернет. Доступ к хорошо структурированным, полнотекстовым электронным библиотекам, лицензионным базам данных, платным электронным ресурсам и иным проверенным и качественным электронным источникам информации может существенно повысить рейтинг библиотеки и увеличить ее посещаемость.

Электронные библиотеки и соответствующие информационные инфраструктуры создаются и развиваются в новом тысячелетии повсеместно. Но, несмотря на то, что понятие «электронная библиотека» появилось в конце 1980–х годов, единого определения до сих пор нет, и на эту тему продолжаются научные споры.

Вильям Армс, известный американский ученый в области электронной информации и автор первой переводной книги по электронным библиотекам, изданной в России предложил определение электронной библиотеки, ставшее впоследствии классическим: электронная библиотека – управляемая коллекция информации в совокупности с соответствующими сервисами, причем информация хранится в цифровых форматах и доступна по сети.

Директор ГПНТБ России А. И. Земсков предлагает следующее определение: электронная библиотека – это тематически ориентированная (или структурированная иным образом) среда доступа к удаленным или локальным электронным ресурсам, способная обслуживать электронными ресурсами локальных или удаленных пользователей.

Большинство специалистов в последнее время приходят к выводу, что электронная библиотека в идеале представляет собой аналог традиционной библиотеки, фонды которой находятся в электронном виде. Поэтому ее обязательными элементами являются: электронный каталог, полные тексты книг в электронном виде, и развитые средства навигации и поиска.

Каждому, кто решил создать электронную библиотеку, приходится принимать множество решений: необходимо определить цели и задачи будущей библиотеки, разработать структуру, найти исполнителей, подготовить методическое и техническое обеспечение, продумать вопросы хранения и сохранности, администрирования и доступа к созданным электронным ресурсам. Каждый вопрос требует отдельного и подробного рассмотрения.

В рамках данного пособия, мы рассмотрим только один программный продукт для создания электронных библиотек или, скорее, электронных коллекций. Это так называемое свободное программное обеспечение, бесплатно распространяемый программный продукт для создания электронных библиотек Гринстоун (GreenStone), который может быть использован в библиотеках для создания, например, электронных коллекций краеведческих материалов.

Для того, чтобы создать цифровую коллекцию, все публикации соответственно должны быть в цифровом формате. Если доступны только твердые копии книг, документов, изображений, а также музыкальных и видео- произведений, то их необходимо оцифровать и обработать в соответствующих прикладных программах, т.е. перевести в форму, считываемую компьютером. Обычно это делается - для обычных текстов путем сканирования и проведения оптического распознавания символов или простым перепечатыванием. Для изображений – путем сканирования и последующей постобработки в графических редакторах. Для звука и видео – путем цифровой перезаписи также с помощью соответствующих прикладных программ.

В данном пособии мы не будем учиться сканировать, распознавать и обрабатывать – эти вопросы подробно, если необходимо, можно рассмотреть отдельно. На данном этапе будем считать, что у вас уже есть некий тематический набор различных электронных документов (текстовых, графических и т.д.), которые необходимо объединить в единый интерфейс с возможностью поиска по всему массиву документов или внутри отдельных коллекций и дальнейшего просмотра по заданным параметрам.


Для этих целей нам необходимо программное обеспечение для электронных библиотек или коллекций.

Российский рынок программного обеспечения для электронных библиотек предлагает разнообразные программные продукты. Они отличаются как по стоимости, так и по функциональности. В целом можно говорить о следующих тенденциях:




  • Используется зарубежное свободно распространяемое программное обеспечение для полнотекстовых коллекций;

  • Создаются собственные разработки ПО для электронных библиотек;

  • Используется программное обеспечение для электронных библиотек как часть программно-технологических комплексов АБИС.

В данном пособии мы будем рассматривать программный продукт, который определяется как свободное программное обеспечение (ПО) и распространяется на основе Генеральной общественной лицензии (или Открытого лицензионного соглашения) GNU. Подробнее см.: http://ru.wikipedia.org/wiki/GNU

Свободное ПО в большинстве своем бесплатно. Это большое преимущество для тех, кто ограничен в средствах (а у библиотек их всегда не хватает), однако существуют некоторые особенности свободного ПО, которые могут стать препятствием на пути создания электронной библиотеки для российского пользователя. Прежде всего, большая часть свободного ПО для полнотекстовых коллекций создано не в России и не всегда можно найти полный пакет документации по работе с данным ПО на русском языке. Кроме того, в силу географического положения страны-разработчика, техническая поддержка для российского пользователя весьма ограничена. Однако открытость исходных кодов дает пользователю неограниченную возможность видоизменять или настраивать ПО, в соответствии с собственными потребностями.

Наиболее известные свободно распространяемые зарубежные программные продукты для полнотекстовых коллекций:




  • Archimede – канадское решение для создания институциональных репозиториев. www.bibl.ulaval.ca/archimede/index.en.html

  • CERN Document Server Software – швейцарский программный комплекс, включающий ПО для электронных библиотек (CDS Invenio или CDSware), ПО для электронных конференций и ПО для конверсии.

www.cdsware.cern.ch

  • DSpace – американский программный продукт для создания открытых электронных репозиториев, разработанный командой специалистов из наиболее известных университетов Соединенных Штатов Америки: Кэмбридж, Массачусетский университет, Колумбийский университет и др.

www.dspace.org

  • E-prints Software – ПО для создания институциональных репозиториев. Разрабатывается Университетом Саусхэмптон (Southampton).

www.eprints.org

  • Koha Open Source Library System – первая открытая интегрированная библиотечная система. Новозеландский продукт, разработанный Katipo Communications Ltd. www.koha.org

  • GNUTECA – совместная французско-бразильская открытая программа для библиотечной автоматизации.

www.gnuteca.org.br


  • Greenstone – новозеландский программный продукт для создания и поддержки электронных библиотек, созданный в Университете Вайкато и др.

www.greenstone.org
В данном пособии мы более подробно рассмотрим ПО Гринстоун (Greenstone).
1. Программное обеспечение Гринстоун (GreenStone)
1.1. Гринстоун: история создания
Прежде чем приобрести современные характеристики, Гринстоун прошел долгий путь разработки и совершенствования: от программного продукта, используемого исключительно для нужд небольшого проекта в Университете Вайкато (Новая Зеландия), до широко распространенного во всем мире свободного ПО в области создания электронных библиотек. Гринстоун сегодня – универсальное, мультиязычное, свободное программное обеспечение для создания электронных библиотек, используемое в более чем 70 странах, работающее на всех наиболее распространенных операционных системах (даже на iPod) и имеющее читательский интерфейс на 43 языках.

Начало работы над проектом по разработке данного ПО можно отнести к 1990 году. В это время проводились отдельные исследования в различных областях по созданию электронных ресурсов, но еще не существовало ни одной целостной, универсальной среды для электронных библиотек. Подобные исследования по компрессии текстов проводились в течение нескольких лет Иеном Виттенем, Дэвидом Бейнбриджем (Ian Witten, David Bainbridge)1 на факультете компьютерных наук Университета Вайкато, Новая Зеландия. Впоследствии они легли в основу разработки в 1995 году в рамках проекта Новозеландская Электронная Библиотека (www.nzdl.org) небольшой программы, позволяющей не только размещать документы в Веб, но и осуществлять полнотекстовый поиск.


В результате этой работы была создана небольшая коллекция документов, состоящая из 50 000 технических отчетов по компьютерным наукам.

В 1997 разработчики Гринстоун приняли участие в проекте, по созданию CD-ROM коллекций гуманитарной информации с возможностью полнотекстового поиска. Проект был инициирован Human Info NGO, Бельгия. Усовершенствованное ПО использовали для создания 40 полнотекстовых коллекций на нескольких языках, которые впоследствии были записаны на диски и распространены в развивающихся странах.

Именно после завершения данного проекта разработчиками было принято решение рассматривать данное ПО как открытый ресурс и использовать Генеральную общественную лицензию (или Открытое лицензионное соглашение) GNU2. В этом же году разработанное программное обеспечение получило название Гринстоун.

Название было выбрано не случайно. Разработчики поставили перед собой непростую задачу: придумать емкое, запоминающееся и достаточно легко произносимое название, к тому же несущее в себе ярко выраженный национальный новозеландский подтекст. После долгих дискуссий, выбор остановили на Гринстоун, который, по мнению создателей ПО, как раз соответствовал всем этим параметрам.



Гринстоун – полудрагоценный камень, который добывался и использовался коренным населением Новой Зеландии – Маори. В традиционном обществе Маори он был самым дорогим и своего рода священным.
Гринстоун символизирует дух или силу жизни, что, по мнению разработчиков ПО, делает его вполне соответствующей эмблемой для программного продукта с открытым кодом: его сияние означает милосердие и отзывчивость; его прозрачность – честность; его твердость – мужество; а острый край может означать справедливость.


Рисунок 1



Традиционный для индейцев Маори топор или тесло (toki) (Рисунок 1), был первоначально выбран в качестве эмблемы для ПО Гринстоун.
В культуре Маори тесло используется в различных целях. Данный вид предназначен для церемоний и является символом высокого положения или власти его обладателя (как правило, таким теслом обладал вождь племени). Это семейная реликвия одного из разработчиков данного ПО.

Однако по этическим соображениям разработчики решили оставить в качестве эмблемы только лезвие тесла (Рисунок 2), сделанное из гринстоуна и остро заточенное, которое и стало легко распознаваемым символом ПО Гринстоун.




Создатели считают, что все качества, присущие гринстоуну также относятся и к программному обеспечению, а острый край резной части, символ того, что в основе разрабо-

Рисунок 2



танного ПО – последние достижения в области создания и поддержки электронных библиотек.

Один из самых первых самостоятельных проектов, где использовалось ПО Гринстоун – создание коллекции газет на языке Маори (Рисунок 3). Созданная при поддержке Министерства образования Новой Зеландии коллекция (Niupepa) до сих пор является крупнейшим собранием документов на языке Маори.

Коллекция содержит более 17 000 страниц из 34 отдельных периодических изданий с 1842 по 1932 год. Она состоит из 4 основных частей:


  • Факсимильные изображения оригинала;

  • Извлеченный текст (для осуществления поиска);

  • Библиографические комментарии;

  • Краткий обзор содержания каждого номера на английском языке.

Создатели получили множество наград за ее разработку, а в день официальной церемонии открытия коллекции представители Маори подарили разработчикам выше упомянутое церемониальное тесло, в знак благодарности за вклад в сохранение языка маори.



Факсимильное изображение одной из оригинальных страниц коллекции Niupepa. Рисунок 3.
Благодаря участию в различных международных проектах ПО Гринстоун получило признание и высокую оценку не только в Новой Зеландии, но и в международном сообществе. Начиная с 2004 года, за создание данного программного продукта разработчики удостаиваются ряда наград и премий, в том числе IFIP Namur, Vannevar Bush, Literati Club Highly Commended Award и др.

Еще в 2003 году силами специалистов из разных стран-членов ЮНЕСКО был проведен анализ существующего свободного программного обеспечения для создания полнотекстовых коллекций, которые оценивались по различным критериям. По оценкам экспертов ЮНЕСКО Гринстоун был признан наиболее простой в использовании из рассмотренных систем, хотя и уступает некоторым системам в функциональности (например, DSpace и Fedora). Однако это единственная система, позволяющая организовывать электронные коллекции на съемных носителях.


Эти и другие характеристики Гринстоун позволили экспертам выделить данное ПО среди свободно распространяемых систем подобного класса и рекомендовать для создания полнотекстовых коллекций. Начиная с 2004 года, ЮНЕСКО и ООН активно поддерживают проекты Университета Вайкато по совершенствованию и распространению Гринстоун. При финансовой поддержке ЮНЕСКО интерфейс Гринстоун переведен на 43 языка, а полный пакет документов по работе с ПО доступен на английском, французском, испанском и русском языках.

Кроме того, в Университете Вайкато при содействии ЮНЕСКО и Human Info (Бельгия) был разработан специализированный учебный курс «Электронные библиотеки в образовании», в основе которого лежит использование программного обеспечения Гринстоун. В 2005 году группой российских специалистов был сделан перевод, адаптация и локализация курса и проведено 15 учебных сессий на английском и русском языках, в которых в общей сложности приняло участие около 200 специалистов.

Как большинство пользователей, которые используют программные продукты с открытым кодом, пользователи Гринстоун в большинстве своем неизвестны.

Международное сообщество внесло огромный вклад в разработку Гринстоун. Созданное тремя талантливыми специалистами, программное обеспечение постоянно совершенствуется, благодаря участию и помощи библиотекарей и программистов всего мира. В 2005 году была выпущена третья версия Гринстоун, в которой усовершенствованы старые и добавлены новые функции.

Любой желающий может подписаться на рассылку по адресу: https://list.scms.waikato.ac.nz/mailman/listinfo/greenstone-users или принять участие в совершенствовании ПО, сообщив об ошибках в работе Гринстоун: greenstone@cs.waikato.ac.nz.

1.2. Гринстоун: назначение и задачи
Основная задача Гринстоун – автоматизированное создание, поддержка и презентация структурированных коллекций электронных документов и мультимедиа ресурсов.
Подзадачи и возможности (этапы создания проекта):


  1. Задание топологической (файловой) структуры коллекций;

  2. Скачивание и локализация удалённых элементов коллекций;

  3. Формирование логической структуры коллекций (индексы разделения);

  4. Выбор схем метаданных и их структуры (Extracted Greenstone Metadata, Dublin Core, RFC 1807 и другие);

  5. Присвоение метаданных единицам хранения (автоматическое извлечение, ручная набивка, импорт, иерархическое наследование);

  6. Установка способов просмотра и представления информации (классификаторы просмотра);

  7. Организация и настройка поиска в коллекциях,

  8. Связывание нескольких коллекций;

  9. Изготовление локально действующих презентационных копий коллекций;

  10. Организация удалённого доступа к коллекциям по сети;

  11. Возможности экспорта данных в другие системы;

  12. Поддержка многоязычных интерфейсов (библиотекаря и пользователя).



1.3. Гринстоун: основные характеристики


  1. Ориентация на низкобюджетные проекты

Несмотря на то, что в Гринстоун предусмотрена возможность создания мультигигабитных коллекций, данное ПО в большей степени рассчитано на небольшие, низкобюджетные проекты, не требующие больших финансовых затрат. Предполагается, что, используя Гринстоун, можно создать и поддерживать электронную библиотеку силами отдельных творческих личностей и самоорганизующихся сообществ библиотечных работников, действующих на различных уровнях – от индивидуального до институционального.




  1. Гринстоун занимает на диске ~ 74 МБ, из них непосредственно программное обеспечение ~ 47 МБ, Ghostview ~1,5 МБ, Ghostscript ~12 МБ, Java ~14 МБ.

Java Runtime Environment необходима для работы Библиотечного интерфейса Гринстоун (Greenstone Librarian Interface) и может быть полезна для расширения встроенных возможностей Гринстоун по генерации веб-страниц интерфейса пользователя. Ghostscript необходим для полноценной работы Гринстоун и многих других программ с форматами PS (Adobe Postscript) и PDF (Portable Document Format). Ghostview устанавливается для обеспечения возможности просмотра файлов в формате PS (Adobe Postscript) и PDF (Portable Document Format).




  1. Для полноценной работы Гринстоун требуется установка Java Virtual Machine (JVM – отдельно), специально адаптированного веб-сервера (встроенный, в версиях, начиная с третьей, это Apache Tomcat) и среды Perl (входит в базовый пакет).

Гринстоун работает совместно с программным обеспечением, которое является также свободно распространяемым: веб-сервер Apache и язык PERL. Интерфейс пользователя использует веб-браузер, обычно это FireFox (Мозилла) или Internet Explorer.




  1. Windows, Linux и др. (даже на iPod)

Гринстоун устанавливается для работы в среде Windows и в среде Unix. Дистрибутив включает готовые к использованию наборы для всех версий Windows, Linux и Mac OS X. Он также включает готовую исходную программу для системы, которая может быть откомпилирована, используя Microsoft C++ или gcc.




  1. Гринстоун поддерживает большинство общеупотребимых форматов документов

В Гринстоун встроены плагины для PDF, PostScript, Word, RTF, HTML, Plain text, Latex, ZIP archives, Excel, PPT, Email. Для мультимедийных документов: изображения (любой формат, включая GIF, JIF, JPEG, TIFF), MP3 audio, Ogg Vorbis audio и др. По различной организации коллекции и работе с плагинами можно создавать либо гомогенные коллекции (документы одной природы, например, MS Word + MS Excel), либо гетерогенные (электронные тексты + отдельные изображения + аудио + видео + …).




  1. Гринстоун поддерживает большинство общеупотребимых метаданных для описания документов

Для описания документов предусмотрена возможность выбрать из встроенных в Гринстоун схем метаданных: Dublin Core (квалифицированный и не квалифицированный уровень), RFC 1807, NZGLS (New Zealand Government Locator Service), AGLS (Australian Government Locator Service), Extracted Greenstone Metadata и др. Кроме того, пользователь может создать любой набор метаданных, используя встроенный в Гринстоун Редактор метаданных. Имеются плагины для XML, MARC, CDS/ISIS, ProCite, BibTex, Refer, OAI, DSpace, METS. На выбор пользователя, метаданные присваиваются единицам хранения различными способами: автоматическое извлечение, ручная набивка, импорт, иерархическое наследование.




  1. Виды поиска и способ предоставления материала (базовые возможности)

По способу представления и поиска материалов:




  1. Лексикографически упорядоченный список (названия, авторы, даты публикации и т.д.);

  2. Иерархический список с агрегацией документов и их частей по логическому подчинению (параграфы, главы, разделы, части, тома, тематические подборки, области знания и т.д.);

  3. Простой поиск (одно поисковое поле, соответствующее однородным метаданным);

  4. Сложная форма поиска с взаимодействием многих полей;

  5. Полнотекстовый поиск (поисковый механизм Phind).




  1. Расположение коллекций, созданных в Гринстоун

Создаваемые в Гринстоун коллекции можно условно разделить по расположению и назначению (преобразуются друг в друга):


Локальная на жёстком диске (доступна только в рамках одного компьютера; допускает редактирование и отладку одним пользователем);
Локальная на съёмном носителе информации (CD, DVD, Flash drive и др.; доступна только в рамках одного компьютера; допускает презентационный просмотр через веб-браузер, редактирование не предусмотрено);

следующая страница >>
Смотрите также:
Программное обеспечение Гринстоун
415.6kb.
3 стр.
П. Ф. Лесгафта г. Санкт-Петербург Л. А. Заварухина информатика (лекции) Санкт-Петербург 2009 Содержание лекция
594.84kb.
4 стр.
Программное обеспечение ЭВМ
209.58kb.
1 стр.
Свободное программное обеспечение (спо) это программное обеспечение, распространяемое на условиях так называемых открытых или свободных лицензий
665.77kb.
7 стр.
Методическая разработка по выполнению контрольной работы по предмету : «операционные системы и программное обеспечение вычислительных комплексов»
127.11kb.
1 стр.
2 программное обеспечение cals-технологий
57.03kb.
1 стр.
Лекция №2. Программное обеспечение пэвм мы уже говорили, что основным наполнением компьютера является программное обеспечение
173.54kb.
1 стр.
Аспекты перехода на свободное программное обеспечение в процессе обучения
43.88kb.
1 стр.
Программа дисциплины «Системное программное обеспечение»
246.8kb.
1 стр.
Программное обеспечение компьютера, состав и структура. Назначение операционной системы. Командное взаимодействие пользователя с компьютером. Графический пользовательский интерфейс. Что такое программное обеспечение
51.38kb.
1 стр.
Учебная программа для специальности: ( рабочий вариант) 1-40 01 01 «Программное обеспечение информационных технологий»
99.78kb.
1 стр.
Учебная программа для специальности: ( рабочий вариант) 1-40 01 01 «Программное обеспечение информационных технологий»
160kb.
1 стр.