Web Scraping teriminin anlamına ve aynı zamanda Selenium Kütüphanesi hakkında bilinmesi gereken temel unsurlara yer veriyoruz.
Günümüzde pek çok alanda kullanılan Python programlama dilinin kullanım alanlarından birinin de Web Scraping olduğu bilinmektedir. Web Scraping, web sitelerinden veri çıkarabilmek için kullanılmakta olan bir veri kazıma tekniğidir. İnternet sitesinin farklı bir forma dönüştürülmesi, sonrasında analiz edilmek için yerel bir veritabanına veyahut elektronik tabloya kopyalanması gibi manipülasyon amacı ile verileri ayıklamak üzerine internet sayfasının HTML’sini işlediği otomatik bir işlem olarak karşımıza çıkar.
Web Scraping’in yaygın olarak kullanılan alanları; Araştırmalar, veri madenciliği, online fiyat izleme ve karşılaştırmalarıdır.
Selenium Ne Demek?
Selenium terimi, web uygulamalarının testini otomatik hale getirebilmek amacıyla kullanılmakta olan, esnek yapısı bulunan, açık kaynaklı bir kütüphane olarak tanımlanabilir. Java, Python, C# ve daha pek çok farklı programlama dillerinde test komutlarının yazılmasını mümkün kılmaktadır. Selenium genel olarak test amaçlı web uygulamalarını otomatikleştirmek maksatlıdır fakat bununla sınırlı olmadığın da belirtmek gerekmektedir. Seçilen tarayıcının açılması, bir insanın yapacağı bazı görevlerin gerçekleştirilmesi gibi işlevleri yerine getirir. Mesela web sayfalardaki belirli bilgileri arama, butonlara tıklama, formlara girme gibi imkanlar sağlamaktadır.
Firefox eklentisi olarak işlev gören Selenium IDE ise Selenium Suite üzerindeki basit çerçevelerden biri olarak kabul edilir. Komut dosyalarının kaydedilmesini ve oynatılmasını mümkün hale getirmektedir. Selenium IDAE kullanılarak komut dosyalarının oluşturulması, gelişmiş ve sağlam test senaryolarının yazılması mümkün hale gelmektedir.
Selenium RC, Senelium 1 olarak da bilinir. Önceden ana Selenium projesi idi. Selenium WebDriver ise komutları kabul etmekte olan ve bunları tarayıcıya göndermeyle yarayan bir tarayıcı otomasyon çerçevesi olarak hizmet göstermektedir. Tarayıcıya özgü bir sürücü aracılığıyla da uygulanabilmektedir. Doğrudan tarayıcı ile iletişim kurmakta ve onu kontrol etmektedir.