Python Beautiful Soup Kütüphanesi ve Basitçe Kullanımı
Python'da HTML ve XML dosyalarını işlemek için, genelde acemi kullanıcılar, düzenli ifadeleri kullanır. Ancak düzenli ifadeler hem hata yapması kolay bir alandır, hem de bu iş için verimli değildir. Diğer yandan, BeautifulSoup gibi bu iş için tasarlanmış, performanslı ve kullanımı kolay bir kütüphanedir.
Beautiful Soup Python için bir HTML ve XML ayrıştırıcısıdır (parser). Beautiful Soup kütüphanesi kullanışlı olmasını şu özelliklerine borçludur:
- Beautiful Soup kötü girdi verseniz bile bozulmaz. Neredeyse orjinal belgenizle aynı anlama gelen bir ayrıştırma ağacı (parse tree) döndürür. Bu özellik çoğu zaman gereken bilgiyi almanız için yeterlidir.
- Beautiful Soup bir ayrıştırma ağacında kolayca gezinme (traversing), arama ve düzenleme yapmanıza olanak sağlayan birçok metot ve Python vari deyimler sağlar: her uygulama için baştan HTML veya XML ayrıştırıcı yazmanıza gerek kalmaz.
- Beautiful Soup gelen belgeleri Unicode'a, giden belgeleri de UTF-8'e kendiliğinden çevirir. Kodlamalarla uğraşmanıza gerek kalmaz.
Beautiful Soup resmi web sitesi
Beautiful Soup Örnekleri
BeautifulSoup belgeleri ve lxml - Python ile XML ve HTML ayrıştırma de ilginizi çekebilir.