Как преобразовать Word, Excel и PowerPoint в PDF в Python

Рассказал, как программно конвертировать эти популярные типы файлов Office в PDF на Python с помощью библиотеки Spire.Office for Python.

4К открытий14К показов

PDF – это широко распространенный формат файлов, который сохраняет форматирование документов на различных устройствах и в разных операционных системах. Люди часто конвертируют файлы Word, Excel и PowerPoint в PDF по нескольким причинам:

  • Универсальность: Преобразование в PDF гарантирует, что документ может быть легко просмотрен и передан другим людям, независимо от установленного у них программного обеспечения.
  • Безопасность: PDF-файлы могут быть защищены паролем или иметь ограниченные права доступа, что обеспечивает дополнительный уровень безопасности для конфиденциальной информации.
  • Удобство печати: PDF-файлы оптимизированы для печати и обеспечивают последовательный вывод, гарантируя, что при печати документ будет выглядеть так же, как на экране.
  • Сжатие файлов: PDF-файлы часто имеют меньший размер по сравнению с оригинальным документом, что упрощает их хранение, обмен и загрузку.

В целом, конвертирование файлов Word, Excel и PowerPoint в PDF обеспечивает совместимость, безопасность и последовательное форматирование, что делает его популярным выбором для обмена и архивирования документов. В этой статье я расскажу, как программно конвертировать эти популярные типы файлов Office в PDF на Python с помощью библиотеки Spire.Office for Python.

  1. Преобразование Word Doc или Docx в PDF в Python
  2. Конвертировать Excel XLS или XLSX в PDF в Python
  3. Конвертировать PowerPoint PPT или PPTX в PDF в Python

Установите необходимые зависимости

Это решение опирается на Spire.Office for Python, который представляет собой комбинацию Spire.Doc for Python, Spire.XLS for Python, Spire.Presentation for Python и Spire.PDF for Python.

Как следует из названия, они представляют собой модули для обработки документов Word, Excel, PowerPoint и PDF соответственно.

Spire.Office for Python можно легко установить с помощью следующей команды pip.

			pip install Spire.Office
		

Преобразование Word Doc или Docx в PDF в Python

Spire.Doc for Python предоставляет метод Document.LoadFromFile(), который позволяет пользователям загрузить файл Doc или Docx.

После этого можно выполнить преобразование в PDF с помощью метода Document.SaveToFile(string filename, ToPdfParameterList parameter).

Объект ToPdfParameterList задает параметры преобразования, такие как отключение гиперссылок, вставка шрифтов и шифрование итогового документа.

			from spire.doc import *
from spire.doc.common import *

# Create a Document object
document = Document()

# Load a Doc or Docx file
document.LoadFromFile("C:\\Users\\Administrator\\Desktop\\input.docx")

# Create a ToPdfParameterList object
parameter = ToPdfParameterList()

# Disable hyperlinks in generated document
parameter.DisableLink = True

# Embed fonts in generated document
parameter.IsEmbeddedAllFonts = True

# Encrypt generated document
parameter.PdfSecurity.Encrypt("openPsd", "permissionPsd", PdfPermissionsFlags.Default, PdfEncryptionKeySize.Key128Bit)

# Save the Word document to PDF
document.SaveToFile("output/ToPDF.pdf", parameter)
document.Close()
		

Преобразование Excel XLS или XLSX в PDF в Python

Пользователи могут использовать метод Workbook.LoadFromFile(), предоставляемый Spire.XLS for Python, для загрузки файла XLS или XLSX.

Затем укажите настройки преобразования через свойства объекта Workbook.ConverterSetting.

После этого вся рабочая книга может быть преобразована в PDF с помощью метода Workbook.SaveToFile().

Чтобы преобразовать конкретный рабочий лист в PDF-документ, используйте метод Worksheet.SaveToPdf().

			from spire.xls import *
from spire.xls.common import *

# Create a Workbook object
workbook = Workbook()

# Load a XLS or XLSX document
workbook.LoadFromFile("C:\\Users\\Administrator\\Desktop\\sample.xlsx")

# Iterate through the worksheets in the workbook
for sheet in workbook.Worksheets: 

    # Get the PageSetup object
    pageSetup = sheet.PageSetup

    # Set page margins
    pageSetup.TopMargin = 0.3
    pageSetup.BottomMargin = 0.3
    pageSetup.LeftMargin = 0.3
    pageSetup.RightMargin = 0.3

# Set worksheet to fit to page when converting
workbook.ConverterSetting.SheetFitToPage = True

# Convert to PDF file
workbook.SaveToFile("output/ToPdf.pdf", FileFormat.PDF)
workbook.Dispose()
		

Преобразование PowerPoint PPT или PPTX в PDF в Python

Преобразование из PowerPoint в PDF также довольно просто.

Просто используйте метод Presentation.LoadFromFile() для загрузки файла PPT или PPTX, а затем конвертируйте его в PDF с помощью метода Presentation.SaveToFile().

Чтобы преобразовать конкретный слайд в PDF, используйте метод ISlide.SaveToFile().

			from spire.presentation import *
from spire.presentation.common import *

# Create an object of Presentation class
presentation = Presentation()

# Load a PPT or PPTX file
presentation.LoadFromFile("C:\\Users\\Administrator\\Desktop\\sample.pptx")

# Convert the presentation file to PDF and save it
presentation.SaveToFile("output/ToPDF.pdf", FileFormat.PDF)
presentation.Dispose()
		
Следите за новыми постами
Следите за новыми постами по любимым темам
4К открытий14К показов