1. Главная страница » Компьютеры » Microsoft word open xml document

Microsoft word open xml document

Автор: | 16.12.2019

Начиная с Microsoft Office 2007, в Microsoft Office используются форматы файлов на основе XML, например DOCX, XLSX и PPTX. Эти форматы и расширения имен файлов применяются к Microsoft Word, Microsoft Excel и Microsoft PowerPoint. В этой статье приводятся основные преимущества формата, описаны расширения имен файлов и описаны способы предоставления общего доступа к файлам Office пользователям, использующим более ранние версии Office.

Microsoft word open xml document

Каковы преимущества форматов Open XML?

Форматы Open XML включают большое количество преимуществ — не только для разработчиков и тех решений, которые они создают, но и для отдельных пользователей и организаций любого размера:

Компактные файлы Файлы автоматически сжимаются, а в некоторых случаях они могут быть не менее 75%. В формате Open XML для хранения документов используется технология сжатия ZIP, что позволяет экономить деньги, так как уменьшает объем дискового пространства, необходимого для хранения файлов, и снижает пропускную способность, необходимую для отправки файлов по электронной почте, через сети и через Интернет. При открытии файла он автоматически размещается в архиве. При сохранении файла он автоматически заархивирован. Для открытия и закрытия файлов в Office не нужно устанавливать специальные служебные программы для работы с ZIP.

Улучшенные возможности восстановления поврежденных файлов. Файлы имеют модульную структуру, поэтому различные компоненты данных файла хранятся отдельно друг от друга. Это позволяет открывать файлы даже в том случае, если компонент в файле (например, диаграмма или таблица) поврежден или поврежден.

Поддержка дополнительных функций Многие дополнительные возможности Office 365 требуют, чтобы документ хранился в формате Open XML. Такие вещи , как автосохранение и Проверка читаемости: в двух примерах можно работать только с файлами, которые ХРАНЯТСЯ в формате Open XML.

Улучшенная конфиденциальность и дополнительный контроль над персональными данными. Доступ к документам может быть конфиденциальным, так как личные данные и конфиденциальные сведения, такие как имена авторов, примечания, исправления и пути к файлам, можно легко идентифицировать и удалить с помощью инспектора документов.

Улучшенная интеграция и совместимость бизнес-данных. Использование форматов Open XML в качестве платформы взаимодействия с данными для набора Office позволяет сохранять документы, листы, презентации и формы в формате XML-файлов, которые можно бесплатно использовать для пользователей и лицензий. Кроме того, Office поддерживает пользовательские XML-схемы, которые улучшают существующие типы документов Office. Это означает, что пользователи могут легко разблокировки информации в существующих системах и работать с ними в знакомых программах Office. Информация, созданная в Office, может быть легко использована другими бизнес-приложениями. Все, что нужно для открытия и редактирования файла Office — это служебная программа ZIP и редактор XML.

Упрощенное обнаружение документов, содержащих макросы. Файлы, сохраненные с использованием суффикса x, используемого по умолчанию (например, DOCX, XLSX и PPTX), не могут содержать макросы Visual Basic для приложений (VBA) и макросы XLM. Макросы могут содержать только те файлы, расширения имен которых заканчиваются на "м" (например, DOCM, xlsm и PPTM).

Microsoft word open xml document

Если вы хотите сохранить файл в двоичном формате, чтение может иметь разные версии Office.

Как преобразовать файл из старого двоичного формата в современный формат Open XML?

Открыв файл в приложении Office, щелкните файл> Сохранить как (или сохранить копию, если файл хранится в OneDrive или SharePoint) и убедитесь, что для типа сохранить как задан современный формат.

Microsoft word open xml document

Это приведет к созданию новой копии файла в формате Open XML.

Что такое расширения имени XML-файла?

По умолчанию документы, листы и презентации, созданные в Office, сохраняются в формате XML с расширениями имен файлов, которые добавляют "x" или "m" к расширениям имен файлов, с которыми вы уже знакомы. "X" обозначает XML-файл без макросов, а "m" обозначает XML-файл, который содержит макросы. Например, при сохранении документа в Word файл теперь использует расширение имени DOCX-файла по умолчанию вместо расширения DOC-файла.

Microsoft word open xml document

При сохранении файла в качестве шаблона отображаются изменения такого же вида. Расширение шаблона, используемое в более ранних версиях, теперь содержит "x" или "m" в конце. Если файл состоит из кода или макросов, необходимо сохранить его с помощью нового формата XML-файлов с поддержкой макросов, который добавляет "m" для макроса к расширению файла.

Читайте также:  Linux mint intel atom

В приведенных ниже таблицах перечислены все расширения имен файлов по умолчанию в Word, Excel и PowerPoint_generic.

В этом разделе показано, как использовать классы в Пакет Open XML SDK 2.5 для Office, чтобы программными средствами открыть документ Word и добавить в него текст. This topic shows how to use the classes in the Open XML SDK 2.5 for Office to programmatically open and add text to a Word processing document.

Для компиляции кода, представленного в этом разделе, требуются следующие директивы сборки. The following assembly directives are required to compile the code in this topic.

Открытие документа и добавление в него текста How to Open and Add Text to a Document

Пакет SDK 2.5 Open XML помогает создать структуру и содержимое документа Word с помощью строго типизированных классов, которые соответствуют элементам WordprocessingML. В этом разделе показано, как использовать классы в Пакет SDK 2.5 Open XML, чтобы открыть документ Word и добавить в него текст. Кроме того, здесь представлена базовая структура документа WordprocessingML, связанные XML-элементы и соответствующие классы пакета Open XML SDK. The Open XML SDK 2.5 helps you create Word processing document structure and content using strongly-typed classes that correspond to WordprocessingML elements. This topic shows how to use the classes in the Open XML SDK 2.5 to open a Word processing document and add text to it. In addition, this topic introduces the basic document structure of a WordprocessingML document, the associated XML elements, and their corresponding Open XML SDK classes.

Создание объекта WordprocessingDocument Create a WordprocessingDocument Object

В пакете Open XML SDK класс WordprocessingDocument представляет пакет документа Word. Чтобы открыть документ Word и работать с ним, создайте экземпляр класса WordprocessingDocument из документа. После создания экземпляра вы сможете получить доступ к основной части документа, содержащей текст. Текст в основной части документа представляется в пакете в виде XML с помощью разметки WordprocessingML. In the Open XML SDK, the WordprocessingDocument class represents a Word document package. To open and work with a Word document, create an instance of the WordprocessingDocument class from the document. When you create the instance from the document, you can then obtain access to the main document part that contains the text of the document. The text in the main document part is represented in the package as XML using WordprocessingML markup.

Чтобы создать экземпляр касса из документа, необходимо вызвать один из методов Open. To create the class instance from the document you call one of the Open methods. Доступно несколько методов с разными подписями. Several are provided, each with a different signature. В примере кода из этой статьи используется метод Open(String, Boolean) с подписью и двумя обязательными параметрами. The sample code in this topic uses the Open(String, Boolean) method with a signature that requires two parameters. Первый параметр — это строка полного пути, представляющая открываемый документ. The first parameter takes a full path string that represents the document to open. Второй параметр — это значение true или false, которое указывает, будет ли файл открыт для редактирования. The second parameter is either true or false and represents whether you want the file to be opened for editing. Если этот параметр имеет значение false, любые изменения, внесенные в документ, не будут сохранены. Changes you make to the document will not be saved if this parameter is false.

В следующем примере кода вызывается метод Open. The following code example calls the Open method.

После открытия пакета документа Word вы можете добавить текст в основную часть документа. Для доступа к тексту основной части документа назначьте ссылку на существующий основной текст, как показано в следующем примере кода. When you have opened the Word document package, you can add text to the main document part. To access the body of the main document part, assign a reference to the existing document body, as shown in the following code example.

Структура документа WordProcessingML Structure of a WordProcessingML Document

Базовая структура документа WordProcessingML состоит из элементов document и body, за которыми следует один или несколько элементов уровня блока, например p, представляющий абзац. Абзац состоит из одного или нескольких элементов r. r представляет прогон областью текста с общим набором свойств, например форматированием. Прогон содержит один или несколько элементов t. t содержит фрагмент текста. В следующем примере кода показана разметка WordprocessingML для документа с текстом "Example". The basic document structure of a WordProcessingML document consists of the document and body elements, followed by one or more block level elements such as p, which represents a paragraph. A paragraph contains one or more r elements. The r stands for run, which is a region of text with a common set of properties, such as formatting. A run contains one or more t elements. The t element contains a range of text. The following code example shows the WordprocessingML markup for a document that contains the text "Example text."

Читайте также:  Crimping tool как пользоваться

С помощью Пакет SDK 2.5 Open XML можно создать структуру и содержимое документа, использующие строго типизированные классы, соответствующие элементам WordprocessingML. Эти классы можно найти в пространстве имен DocumentFormat.OpenXml.Wordprocessing . В следующей таблице перечислены имена классов, соответствующие элементам document, body, p, r и t. Using the Open XML SDK 2.5, you can create document structure and content using strongly-typed classes that correspond to WordprocessingML elements. You will find these classes in the DocumentFormat.OpenXml.Wordprocessing namespace. The following table lists the class names of the classes that correspond to the document, body, p, r, and t elements.

Элемент WordprocessingML WordprocessingML Element Класс Open XML SDK 2.5 Open XML SDK 2.5 Class Описание Description
document document Document Document Корневой элемент основной части документа. The root element for the main document part.
body body Body Body Контейнер для структур уровня блока, таких как абзацы, аннотации, и других, указанных в стандарте ISO/IEC 29500. The container for the block level structures such as paragraphs, tables, annotations, and others specified in the ISO/IEC 29500 specification.
p p Paragraph Paragraph Абзац. A paragraph.
r r Run Run Прогон. A run.
t t Text Text Диапазон текста. A range of text.

Создание разметки WordprocessingML для добавления текста Generate the WordprocessingML Markup to Add the Text

После получения доступа к тексту основной части документа вы можете добавить текст в документ. Для этого добавьте экземпляры классов Paragraph, Run и Text. При этом будет создана необходимая разметка WordprocessingML. Следующий пример кода добавляет абзац, прогон и текст. When you have access to the body of the main document part, add text by adding instances of the Paragraph, Run, and Text classes. This generates the required WordprocessingML markup. The following code example adds the paragraph, run and text.

Пример кода Sample Code

Пример метода OpenAndAddTextToWordDocument, показанный здесь, можно использовать для открытия документа Word и добавления текста с помощью пакета Open XML SDK. Для вызова этого метода передайте полный путь к файлу в качестве первого параметра и текст в качестве второго параметра. Например, следующий пример кода открывает файл Letter.docx в папке "Общие документы" и добавляет в него текст. The example OpenAndAddTextToWordDocument method shown here can be used to open a Word document and append some text using the Open XML SDK. To call this method, pass a full path filename as the first parameter and the text to add as the second. For example, the following code example opens the Letter.docx file in the Public Documents folder and adds text to it.

Далее представлен полный пример кода на языках C# и Visual Basic. Following is the complete sample code in both C# and Visual Basic.

Обратите внимание, что метод OpenAndAddTextToWordDocument не содержит явный вызов метода Save. Это связано с тем, что функция автосохранения по умолчанию включена, и она не была отключена в вызове метода Open с помощью OpenSettings. Notice that the OpenAndAddTextToWordDocument method does not include an explicit call to Save. That is because the AutoSave feature is on by default and has not been disabled in the call to the Open method through use of OpenSettings.

Office Open XML (OOXML, DOCX [1] , XLSX, PPTX, проект ISO/IEC IS 29500:2008) — серия форматов файлов для хранения электронных документов пакетов офисных приложений — в частности, Microsoft Office. Формат представляет собой zip-архив, содержащий текст в виде XML, графику и другие данные [2] , которые могут быть переведены в последовательность битов (сериализованы) с применением защищённых патентами двоичных форматов, спецификации которых были опубликованы Microsoft для пользователей OOXML на условиях Microsoft Open Specification Promise [en] .

Первоначально формат создавался как замена прежнему двоичному формату документов, который использовали приложения Microsoft Office вплоть до версии Office 2003 включительно. В 2006 году формат Office Open XML был объявлен свободным и открытым форматом Ecma International. Он является форматом по умолчанию для приложений Microsoft Office 2007 и более поздних.

Две разные версии OOXML определены в ECMA-376 [1] [3] и в ISO 29500:2008. Полная поддержка формата ISO 29500 ожидалась (но не появилась) в Microsoft Office 2010.

Содержание

Стандартизация [ править | править код ]

Microsoft Office, появившийся в 80-е годы, не рассчитывался на взаимообмен. Если же нужно использовать документы Office в чужом ПО — для этого есть Component Object Model и более простые форматы наподобие RTF [4] .

К 2005 году участились призывы к госструктурам переходить на открытые форматы. Если в бывшем СССР культура пользования лицензионным ПО была ещё слаба, в Европе закрытый формат правительственных документов фактически стал требованием платить из государственных бюджетов Microsoft — американской компании — несколько сотен долларов за рабочее место. Осознав, что у неё нет подходящего формата, а конкуренты, OASIS, проводят свой ODF через ISO, Microsoft на основе своих DOC и XLS создала свой XML-формат и провела его через Ecma International и ISO. Началась эта процедура в 2006 году и закончилась в 2008 — чуть больше двух лет на всё (ODF начали стандартизировать ещё в 2002-м, и спустя 15 лет работа всё ещё далека от завершения). Оппоненты обнаружили в этом начинании множество нарушений внутренних процедур ISO.

Читайте также:  Garmin vivoactive 3 сравнение

Ecma International [ править | править код ]

Microsoft заявила, что Office Open XML будет открытым стандартом, и представила его на утверждение Ecma International (ECMA). 8 декабря 2005 года ECMA организовала технический комитет 45 (TC45), чтобы «выпустить формальный стандарт для офисных приложений, полностью совместимый с форматами Office Open XML, представленными Microsoft». Предложение также поддержали Apple Inc., Barclays Capital, BP, the British Library, Essilor, Intel, NextPage., Statoil ASA и Toshiba [5] .

ISO/IEC [ править | править код ]

5 сентября 2007 года принятие варианта OOXML как стандарта ISO/IEC 29500 было временно отклонено по результатам голосования [6] .

В марте 2008 года изменённая спецификация была принята как будущий стандарт ISO/IEC 29500. В частности, в Норвегии при этом были отмечены нарушения процесса стандартизации [7] . Позже оказалось, что файлы, сохраняемые Microsoft Office 2007, не проходят тестов на соответствие стандарту, что нарушает правила принятия стандарта через процедуру Fast-Tracking , требующие, чтобы существовали реализации стандарта [8] .

В мае 2008 были поданы апелляции от ЮАР [9] [10] , Бразилии и Индии [11] [12] , Венесуэлы [13] . Также подана жалоба о нескольких нарушениях от Open Source Leverandørforeningen в Дании [14] .

Публикация ISO/IEC DIS 29500 была отложена на период рассмотрения апелляций (30 дней) [15] [16] .

В июле руководители ISO и IEC порекомендовали Technical Management Board отклонить апелляции, указав в качестве причины то, что проект стандарта был принят голосованием в соответствии с директивами ISO/IEC JTC 1 [17] .

В августе ISO отклонила апелляции стран, выступающих против принятия OOXML как стандарта, так как они не смогли получить поддержку необходимого числа участников ISO для приостановления принятия стандарта [18]

В конце августа государственные IT‐организации Бразилии, ЮАР, Венесуэлы, Эквадора, Кубы и Парагвая опубликовали заявление о сомнениях в нейтральности ISO [19] [20] .

В Норвегии, где из 21 голоса «против» и двух голосов «за» получилось «за», 29 сентября 2008 года 13 членов технической комиссии в знак протеста вышли из состава Standard Norge ( норв. ) [21] [22] [23] .

По данным собрания ISO/IEC JTC1/SC34, подкомиссии ISO/IEC JTC1, в начале октября SC34 отправила OASIS неопубликованный запрос на передачу ей контроля над стандартом ISO/IEC 26300 (ODF), обосновывая это стремлением к лучшей совместимости между стандартами. В Groklaw также обратили внимание на то, что 9 из 20 присутствовавших на собрании в июле являлись сотрудниками или консультантами Microsoft, либо членами ECMA TC45. В результате появились подозрения в попытке захвата Microsoft контроля над ODF [24] [25] [26] .

Дальнейшая жизнь стандарта [ править | править код ]

После того, как OOXML стандартизовали, работа над стандартом приостановилась; Microsoft Office 2010 всё ещё отвечал «переходным» требованиям OOXML, но не «строгим». Microsoft пообещал полное соответствие в следующей версии. ISO пригрозила убрать переходные части из стандарта [27] .

Office 2013 начал поддерживать строгий OOXML [28] . По умолчанию сохранение всё ещё, даже на 2016 год, идёт в переходной [29] .

25 июня 2014 года Microsoft выпустила Open XML SDK в open source под лицензией Apache 2.0 [30] .

Microsoft word open xml document

Поддержка в текстовых процессорах [ править | править код ]

Предыдущие версии MS Office [ править | править код ]

Большей популярностью на 2007 год пользуются его предшественники — двоичные форматы Microsoft Office 97—2003. Поддержка одной из версий OOXML (не соответствующая ISO/IEC 29500) появилась в Microsoft Office 2007 [8] . Для работы с этим форматом в предыдущих версиях MS Office Microsoft предлагает установить Microsoft Office Compatibility Pack, который обеспечивает «прозрачную» работу с форматами Office 2007 пакетов MS Office 2000, XP и 2003 [31] .

Поддержка формата в других текстовых процессорах [ править | править код ]

В OpenOffice.org 3 версии присутствует частичная встроенная поддержка OOXML. Для решения данной проблемы существуют онлайн-конверторы, способные конвертировать формат DOCX в другие форматы. Также существует плагин (разработанный фирмой Novell), позволяющий открывать и сохранять файлы в этом формате в ОС семейств SUSE и Microsoft Windows [32] .

Поддержка формата OOXML в текстовом процессоре Corel Word Perfect ожидалась в середине 2007 года [33] .

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *