Python Pandas ile Aynı Anda Birden Fazla Excel Dosyasını Okumak

Dosya veri kaynakları arasında csv uzantılı dosyalar kadar excel dosyaları da bulunmaktadır. Pandas kütüphanesi her ne kadar bize bir .xls veya .xlsx uzantılı excel dosyalarını okumamıza imkan tanısa da bir dizin içinde birden fazla excel dosyasını okumak gerektiğinde iş bu kadar basit olmuyor. Birden çok excel dosyasını aşağıdaki gibi okuyabiliriz.

import glob
import pandas as pd
all_data = pd.DataFrame()
for f in glob.glob("excel_dosyalarının_bulunduğu_dizin/*.xlsx"):
    df = pd.read_excel(f,"SheetName")
    all_data = all_data.append(df,ignore_index=True)

yukarıda all_data ile her for döngüsünde ekleyeceğimiz boş bir dataframe yaratıyoruz. glob modülü ise bize dizin içindeki .xlsx uzantılı dosyaların isimlerini toplamamızı sağlıyor. Topladığımız bu isimleri dolaşarak tek tek normal excel okur gibi okuyoruz ve all_data’ya ekliyoruz.

İstersek okuyup birleştirdiğimiz dataframe’i tek dosya halinde diske tekrar yazabiliriz.

Pandas Dataframe’i Diske Yazmak

all_data.to_csv(path_or_buf="Yazılacak_dizin/dosya_adı.csv",
          sep="|", index=False, header=True)

Yazar Hakkında
Toplam 173 yazı
Erkan ŞİRİN
Erkan ŞİRİN
2014'ten beri hem akademik alanda hem de sektörde pratik anlamda büyük veri ve veri bilimi ile ilgili çalışmalar yürütmektedir. Büyük veri ve veri bilimi ile ilgili birçok kurum ve şirkete danışmanlık ve eğitimler vermekte, projeler icra etmektedir. Çalışma alanları: büyük veri platformlarının kurulum ve yönetimi, büyük veri üzerinde makine öğrenmesi, olağan dışılık ve sahtecilik tespiti, akan veri işleme ve veri hazırlama sürecidir.
Yorumlar (Yorum yapılmamış)

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

×

Bir Şeyler Ara