Davranışsal Hedefleme, Dijital Pazarlama

CRISP Nedir? CRISP Sürecinde Kullanılan 6 Aşama

crisp

Veri madenciliği bir çok farklı aşamadan oluşur. Neredeyse her veri madenciliği çalışmasında verilerin kaynaklardan toplanması ve entegrasyonu, verilerin temizlenmesi, modelin oluşturulması, modelin denenmesi ve sonuçların sunuma hazırlanması adımları karşımıza çıkar.

CRISP-DM (Cross Industry Standard Process Model for Data Mining) endüstri ve kullanılan yazılımdan bağımsız bir veri madenciliği süreç modelidir. CRISP-DM veri madenciliği süreçlerini, kullanılan yazılımdan ve endüstriden bağımsız standartlaştırmayı amaçlar.  CRISP-DM yazılım geliştiricileri ve farklı endüstrilerden gelen bir çok firmanın üyesi olduğu bir oluşum tarafından geliştirilmiştir.

CRISP-DM Dört Seviyeden Oluşur

  • Fazlar
  • Genel Görevler
  • Özelleşmiş Görevler
  • Süreç Örnekleri

CRISP Süreç Modeli Seviyeleri

Fazlar modelin en üst seviyesini oluşturur ve veri madenciliği süreçlerinin temel görevleridir.

Genel görevler, özel durumlardan bağımsız olarak fazın gerçekleşebilmesi için yerine getirilmesi gereken görevleri, karşılaşılan durumdan bağımsız olarak belirler.

Özel görevler, farklı durumları dikkate alır. Örneğin verinin niteliğinden bağımsız olarak verinin temizlenmesi isimli bir genel görev var ise, bu görevin altında kategorik verinin temizlenmesi ve sayısal verinin temizlenmesi şeklinde iki özel görev bulunabilir.

Dördüncü ve en alt seviyedeki süreç örnekleri aşaması ise, gerçekleştirilecek olanlardan ziyade, gerçekleştirilecek olanlar ile ilişkili olarak gerçekleştirilmiş olanların tutulmasıdır. Bir çeşit, CRISP-DM modeline birebir eşlenmiş olan proje günlüğü olarak düşünebiliriz.

CRISP-DM süreç modelinin fazları işin anlaşılması, verinin anlaşılması, verinin hazırlanması, modelleme, test ve uygulamadır.

1- İşin Anlaşılması

İşin anlaşılması aşamasında, veri madenciliği çalışmasının yapılmaya çalışılan işe ne katkı sağlayacağı netleştirilmeye çalışılır. Böylece, proje hedeflerinin yarar sağlayacak şekilde netleşmesi ve  projedeki bütün aktivitelerin hedefe yönelik olması sağlanacaktır.

Bu aşama işi icra eden kişilerin bir sorunu ifade etmesi ve bu sorunun bir veri madenciliği problemine indirgenmesi şeklinde de gerçekleşebilir. İşin anlaşılması aşaması aşağıdaki görevlerden oluşur.

  • İş amaçlarının belirlenmesi aşamasında iş sahiplerinin neyi amaçladığı belirlenmeye çalışılır. Örneğin bir telekom şirketi elindeki müşteri verilerini kullanarak hangi müşterilerin, başka bir telekom şirketine geçme eğiliminde olduğunu mu saptamaya çalışmaktadır, yoksa müşterilerine dönük pazarlama faaliyetlerini özelleştirebilmek adına, benzer özellikte müşterilerini gruplamaya mı çalışmaktadır.
  • Mevcut durumun değerlendirilmesi aşamasında projedeki kaynaklar ve riskler ele alınır. Elimizde hangi veriler var, hangi yazılımları kullanabiliriz, donanımlarımız nelerdir, proje sırasında karşılaşabileceğimiz sorunlar nelerdir gibi sorulara cevaplar aranır.
  • Veri madenciliği amaçlarının belirlenmesi aşaması gerçekleştirilmeye çalışılan iş amacın veri madenciliği terminolojisi ile ifadesidir. Örneğin; iş amacının “Satışların artırılması amacıyla, kasada müşterinin en çok satın alma ihtimali olan ürünün müşteriye önerilmesi” olduğu bir durumda, veri madenciliği amacı “Birliktelik kuralları kullanarak, birlikte satın alınan ürünlerin saptanması” olabilir.
  • Proje planının oluşturulması aşamasında projedeki bütün adımların, hangi tarihlerde gerçekleştirilecekleri ve hangi kaynaklar ile gerçekleştirilecekleri belirlenir.

Öneri: Aşağıdaki yazılarımız da ilginizi çekebilir 😉

2- Verinin Anlaşılması

Verinin anlaşılması aşamasında, proje sırasında kullanılacak verinin kalite, sayı, ulaşılabilirlik gibi açılardan ne durumda olduğu değerlendirilir. Verinin anlaşılması aşağıdaki aşamalardan oluşur:

  • Verinin yüklenmesi aşamasında veri ilgili kaynaklardan çekilerek, analizin yapılacağı yazılıma yüklenir. Farklı kaynaklardaki verilerin bir arada kullanılması gerekiyorsa, entegrasyon ile ilgili sorunların çözülmesi gerekir.
  • Verinin anlatılması aşamasında elde ne kadar sayıda kayıt olduğu, kayıtların kaç alandan (özellik) oluştuğu gibi bilgiler toplanır.
  • Verinin keşfi aşamasında basit istatistik veya görselleştirme yöntemleriyle, eldeki veri hakkında söylenebilecekler belirlenir. Örneğin, eldeki verilerin dağılımı, ortalama değerleri veya varsa veriler arasındaki korelasyon hakkında saptamalar yapılır.
  • Veri Kalitesinin Doğrulanması aşamasında eldeki verinin yeterli olup olmadığı, bütün farklı durumları kapsayıp kapsamadığı, eksik ve yanlış verilerin miktarı saptanır.

3) Verinin Hazırlanması

Bu aşamada, toplanan veri model oluşturma işlemine hazır hale getirilir. Verinin hazırlanması aşağıdaki aşamalardan oluşur:

  • Verinin seçilmesi aşamasında elde olan verilerden hangilerinin modelleme sırasında kullanılacağı belirlenir. Bu aşamada bazı kayıtlar çıkarılabileceği gibi örneğin modeli olumsuz etkileyebilecek uç veriler, bazı alanlar da (özellik) çıkarılabilir. Örneğin: evdeki oda sayısı ve evin alanı gibi birbiri ile yüksek korelasyona sahip veriler.
  • Verinin temizlenmesi aşamasında modelin oluşmasına engel olabilecek veya modeli bozabilecek veriler çıkarılır. Bazen de eksik veriler bir model aracılığıyla tahmin edilerek yerine konur.
  • Verinin inşaası aşamasında, mevcut veriler kullanılarak yeni veri alanları oluşturulur. Örneğin boy ve en verisi yerine alan verisi konulur.
  • Verinin entegrasyonu aşamasında farklı kaynaklardaki veriler birleştirilir. Örneğin bir süper market, müşteri verisini bir tabloda, satış verisini ise başka bir tabloda tutuyor olabilir. Eğer müşterileri satış verisi ile birlikte işlemek istiyorsak, bu veriler birleştirilir.
  • Verinin biçimlendirilmesi aşamasında veriler modelleme için ihtiyaç duyulan biçime getirilir. Örneğin; emlak verisinin incelendiği bir projede, veriler içinde oda sayısı, salon sayısı + oda sayısı (Örnek: 2+1,3+1 vb.)şeklinde verilmiş olabilir. Oda sayısını sayısallaştırmak için toplam oda sayısı olacak şekilde biçimlendirme yapabiliriz.

4- Modelleme

Bu aşamada farklı modelleme tekniklerinden eldeki veriye ve yapılmak istenen işe en uygun olanı seçilerek uygulanır. Modelleme aşağıdaki aşamalardan oluşur:

  • Modelleme tekniğinin seçilmesi aşamasında modelleme sırasında kullanılacak teknik belirlenir. Örneğin: sınıflandırma için karar ağaçları mı kullanacağız yoksa sinir ağları mı? Bazen eldeki yazılım bağlamında hangi algoritmanın kullanılacağı da bu aşamada belirlenir. Örneğin birliktelik kurallarını Apriori algoritmasi ile mi belirleyeceğiz yoksa FP-Growth algoritması ile mi?
  • Testin belirlenmesi aşamasında model oluşturduktan sonra, modelimizin kalitesini hangi test ile doğrulayacağımızı belirleriz. Örneğin sınıflandırma yapacaksak, verinin bir kısmını modelin geliştirmesi ve kalan kısmını da modelin testi için kullanarak test sırasında oluşturulan modelin karar verdiği sınıflandırmaların yüzde kaçında yanlış karar verdiğini belirleyebiliriz.
  • Modelin oluşturulması aşamasında modelin parametrelerinin belirlenmesi ve modelin oluşması için ilgili yazılımın çalıştırılması gerçekleştirilir.
  • Modelin değerlendirilmesi aşamasında veri madenciliği mühendisi, modelin başarısını teknik olarak testin belirlenmesi aşamasında belirlenen kriterlere göre değerlendirir. Bu aşamada farklı modelleri, test kriteri karşısındaki başarılarına göre sıralayabilir.

5- Değerlendirme

Bir önceki aşamada sonuçlar veri madenciliği açısından değerlendirilmişti. Bu aşamada ise sonuçlar, proje başında belirlenen iş amaçları açısından değerlendirilir. Değerlendirme aşağıdaki aşamalardan oluşur:

  • Sonuçların değerlendirilmesi aşamasında sonuçlar, iş sahipleri ile birlikte değerlendirilir. Sonuçların, proje başında belirlenen iş hedeflerini karşılayıp karşılamadığı değerlendirilir. Kaynakların yeterli olduğu koşullarda modelin gerçek koşullarda uygulaması yapılarak deneme gerçekleştirilir.
  • Modelimiz, artık iş sonuçları açısından da onaylanmıştır. Sürecin gözden geçirilmesi aşamasında bir kalite kontrol süreci olarak baştan sona bütün süreç bir daha değerlendirilir. Doğru verileri mi kullandık, bazı verilere gereğinden fazla mı önem verdik gibi sorulara cevap aranır.
  • Bir sonraki adımın kararlaştırılması aşamasında konuşlandırma aşamasına mı geçileceği yoksa yeniden sürecin tekrarlanıp tekrarlanmayacağı belirlenir.

6- Konuşlandırma

Bu aşamada model gerçek hayat içinde kullanıma geçirilir. Örneğin, bir telekom firması için yapılabilecek, “başka bir telekom firmasına geçme ihtimali yüksek müşterilerin saptanması çalışması” sonucunda belirlenen müşterilere promosyon uygulanır.

  • Konuşlandırmanın planlanması aşamasında Modelin veya sonuçların kullanılabilmesi için yapılması gerekenler planlanır.
  • Gözlemlemenin ve Bakımın Planlanması aşamasında gözlemleme ve bakım, işlemleri, sistemin sağlıklı çalışması için planlanır.
  • Nihai raporun oluşturulması aşamasında proje lideri ve ekibi proje sonuçlarını ilgililer için raporlar.
  • Proje değerlendirilmesi aşamasında proje neyin doğru neyin yanlış yapıldığı ve nelerin daha iyi yapılabileceği açısından değerlendirilir.
İlginizi Çekebilir:
Lead-Nurturing
Lead Nurturing Yapabilmeniz İçin Kullanabileceğiniz 5 İletişim Kanalı
kisisellestirme-metodlari
Web Sitesinde ve E-postada Kişiselleştirilmiş Öneri Sunmanın Yolları

Lütfen yorumunuzu paylaşın

Yorumunuz

Adınız
Web siteniz

Önceki yazıyı okuyun:
web-sitesi-yapilmamasi-gereken-10-hata
Web Sitesi Hazırlarken Asla Yapmamanız Gereken 10 Hata

Şirketiniz için web sitesi ilk kez yapmak ya da yeniden tasarım ve düzenleme sürecine girmek heyecan verici olduğu kadar zorlu...

Kapat