docs.kde.org
Технические подробности KWord
Пред.
След.

Приложение E. Технические подробности KWord

Содержание

Формат файла KWord
KWord 1.1 и более ранние
KWord 1.2
KWord 1.3 (текущая версия)
MIME-типы Kword

Формат файла KWord

Mike McBride

KWord использует два открытых, независимо разработанных стандарта для формата своего файла. Это сочетание было выбрано ради баланса между удобством и открытостью разработки.

Прежде всего, нужно сказать, что все файлы KWord - это просто несколько файлов XML, сжатых ради экономии места.

Выберите версию KWord:

KWord 1.1 и более ранние

Файлы XML сжаты в один архивный файл с помощью алгоритма tar.

Эти файлы можно разжать командой:

% tar -xzvf имя_файла

Тем самым документ KWord будет разархивирован в свои составляющие файлы.

Текстовая часть во всех файлах KWord описана в формате XML (eXtensible Markup Language - расширяемый язык разметки).

Замечание

Более подробно с документами XML, их обработчиками и технологиями можно познакомиться на следующих страницах:

Веб-страницы консорциума World Wide Web, посвященные XML
Путеводитель по ресурсам XML.org
Вопросы и ответы по XML

Документ KWord включает в себя как минимум два файла XML:

maindoc.xml

В этом файле содержится большая часть текста KWord, таблицы и формулы. Он размечен тегами XML согласно официальному DTD. Копия DTD для KWord 1.1 хранится по адресу: http://www.koffice.org/DTD/kword-1.1.dtd.

documentinfo.xml

В этом файле хранятся сведения о документе. Именно они вводятся в диалоге при выборе пункта меню Файл->Сведения о документе. Эта информация полезна для сбора данных об авторах, их контактах и пр.

Копия DTD для KOffice 1.1 хранится здесь: http://www.koffice.org/DTD/document-info-1.1.dtd.

Кроме этого, в документ KWord могут входить и другие файлы. Рисунки, встроенные файлы и прочие двоичные данные входят в документ KWord как отдельные файлы.

Более подробно с форматом файла KWord и прочей технической информацией можно познакомиться на страницах KOffice API и ресурсе для разработчиков KDE.

KWord 1.2

Текстовые файлы сжимаются в единый файл с помощью алгоритма zip. Это изменение было сделано ради улучшения производительности и уменьшения требований к памяти, а также потому, что оно очень широко используется в других открытых офисных пакетах.

Эти файлы можно разжать командой:

% unzip имя_файла

Тем самым документ KWord будет разархивирован в свои составляющие файлы.

Текстовая часть во всех файлах KWord описана в формате XML (eXtensible Markup Language - расширяемый язык разметки).

Замечание

Более подробно с документами XML, их обработкой и технологиями можно познакомиться на следующих страницах:

Веб-страницы консорциума World Wide Web, посвященные XML
Путеводитель по ресурсам XML.org
Вопросы и ответы по XML

Все документы KWord состоят как минимум из трёх файлов:

maindoc.xml

В этом файле содержится большая часть текста KWord, таблицы и формулы. Он размечен тегами XML согласно официальному DTD.

Копия DTD для KWord 1.2 хранится здесь: http://www.koffice.org/DTD/kword-1.2.dtd.

documentinfo.xml

В этом файле хранятся сведения о документе. Именно они вводятся в диалоге при выборе пункта меню Файл->Сведения о документе. Эта информация полезна для сбора данных об авторах, их контактах и пр.

Копия DTD для KOffice 1.2 хранится здесь: http://www.koffice.org/DTD/document-info-1.2.dtd.

mimetype

Этот файл содержит типы MIME файлов KWord. KDE использует эту информацию, чтобы отличать файлы KWord от других файлов.

Этот файл обязательно содержит строку: application/x-kword

Кроме этого, в документ KWord могут входить и другие файлы. Рисунки, встроенные файлы и прочие двоичные данные входят в документ KWord как отдельные файлы.

Более подробно с форматом файла KWord и прочей технической информацией можно познакомиться на страницах KOffice API и ресурсе для разработчиков KDE.

KWord 1.3 (текущая версия)

Текстовые файлы сжимаются в единый файл с помощью алгоритма zip. Это изменение было сделано ради улучшения производительности и уменьшения требований к памяти, а также потому, что оно очень широко используется в других открытых офисных пакетах.

Эти файлы можно разжать командой:

% unzip имя_файла

Тем самым документ KWord будет разархивирован в свои составляющие файлы.

Текстовая часть во всех файлах KWord описана в формате XML (eXtensible Markup Language - расширяемый язык разметки).

Замечание

Более подробно с документами XML, их обработкой и технологиями можно познакомиться на следующих страницах:

Веб-страницы консорциума World Wide Web, посвященные XML
Путеводитель по ресурсам XML.org
Вопросы и ответы по XML

Все документы KWord состоят как минимум из трёх файлов:

maindoc.xml

В этом файле содержится большая часть текста KWord, таблицы и формулы. Он размечен тегами XML согласно официальному DTD.

Копия DTD для KWord 1.3 хранится здесь: http://www.koffice.org/DTD/kword-1.3.dtd.

documentinfo.xml

В этом файле хранятся сведения о документе. Именно они вводятся в диалоге при выборе пункта меню Файл->Сведения о документе. Эта информация полезна для сбора данных об авторах, их контактах и пр.

Копия DTD для KOffice 1.3 хранится здесь: http://www.koffice.org/DTD/document-info-1.2.dtd.

mimetype

Этот файл содержит типы MIME файлов KWord. KDE использует эту информацию, чтобы отличать файлы KWord от других файлов.

Этот файл обязательно содержит строку: application/x-kword

Кроме этого, в документ KWord могут входить и другие файлы. Рисунки, встроенные файлы и прочие двоичные данные входят в документ KWord как отдельные файлы.

Более подробно с форматом файла KWord и прочей технической информацией можно познакомиться на страницах KOffice API и ресурсе для разработчиков KDE.

Пред.
След.
Начало


docs.kde.org