Python doc ve docx

Yorum bırakın

12/10/2013 tarafından electrocoder

matlab76_ugur_arifoglu.jpg

      Matlab ile daha önce gerçekleştirdiğim bir uygulamayı python ile tekrar yazmaya karar verdiğimde karşılaşacağım zorlukların farkında idim. Biraz erken olması hayal kırıklığına uğrattı esasında ama sonraki manzara dahada kötüydü. Problem Ubuntu üzerinde Microsoft Word *.doc formatındaki dosyaların okunması sırasında oluştu. Yani Linux üzerinde *.doc dosyasını açmayı bir türlü yapamadım. Bunu için daha önce bir modül yazılmış olabileceğini tahmin ediyordum ama umduğum gibi olmadı. Sorun Ofis 2007 formatını okuyabilen bir modül bulmam ile kısmen çözüldü ama hala Ofis 2003 formatını okuyamıyorum.
      Ofis 2007 formatındaki dökümanları okumak için kullandığım modulün adı ‘python-docx’. Microsoft Word 2007/2008 docx formatını okumak için %100 python ile yazılmış ve uygulamanın github sayfasına

buradan 

      ulaşabilirsiniz.
      Uygulamayı indirdikten sonra extract ediyoruz ve “python setup.py install” komutu ile kuruyoruz.
      Python shell’ i açalım ve aşağıdaki komutları verelim;
#! /usr/bin/env python
#-*- coding: utf8 -*-
from docx import * #kütüphane dosyamızı kullanmak için

document = opendocx('iletisim.docx') #2007 formatındaki dosyamızın tam yolu verilmelidir
doc = getdocumenttext(document) #dosyadan okuma yap
for i in doc:
    print i #ekrana yaz
      Prof.Dr.Uğur ARİFOĞLU hocamızın MATLAB 7.6 kitabını

buradan

      temin edebilirsiniz.
Reklamlar

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Google+ fotoğrafı

Google+ hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Connecting to %s

%d blogcu bunu beğendi: