VERİ KAZIMA NEDİR?

Python ile Veri Kazıma(Web Scraping) Çalışması: Dünya Halleri Verisinin Kazınıp, Analiz Edilmesi ve Modellenmesi

VERİ KAZIMA NEDİR?

Merhaba Sevgili okurlar, uzun bir aradan sonra sizlerle beraber olmak mutluluk verici. Umarım iyisinizdir. Bugün sizlere dunyahalleri.com’dan veri kazıma yöntemleri ile kazıyıp farklı kütüphaneler ile analiz ettiğim çalışmadan bahsedeceğim. Yazımızın içeriği şu şekilde olacak;

  1. Veri Kazıma Nedir?
  • Neden Veri Kazırız?
  • Veri Kazıma Nasıl Çalışır?
  • Veri Kazıma Yöntemleri
  • Python ile Veri Kazıma

2. Python ile DunyaHalleri.com’un verisinin kazınması

  • Veri Kazıma Stratejisi
  • BeautifulSoup ile Kategori Altındaki Haber Linklerinin Toplanması
  • Haber Metninin Seçilmesi
  • Haber Özetinin Seçilmesi
  • Haber Başlığının ve Zamanının Seçilmesi

3. Verinin Analizi ve İçeriye Alınması

  • Verinin Görselleştirilmesi ve Analizi
  • Haber Metinlerinin Kategorilerine Göre Sınıflandırılması
  • Word2Vec ile Modelleme
  • TSNE ile Word2Vec Görselleştirilmesi
  • TextScatter ile Kategorilerin Derin Analizi

4. Sonuç

5. Kodlar ve Kaynakça

Öncelikle bu çalışma 5.sini düzenlediğimiz “Araştırma ve Geliştirme Odaklı Yapay Zeka Eğitimi” için bir başvuru sorusuydu. Veri kazıma izni için Serdar Kuzuloğlu’na ayrıca teşekkürler.