Veri madenciliği, büyük ölçekli veriler arasından faydalı bilgiye ulaşma, bilgiyi madenleme işidir. Büyük veri yığınları içerisinden gelecekle ilgili tahminde bulunabilmemizi sağlayabilecek bağıntıların bilgisayar programı kullanarak aranması olarak da tanımlanabilir.
Günümüzde teknolojinin gelişmesi ile birlikte internet ortamında geçirilen süreler, yedeklenen belgeler, atılan mailler, videolar, fotoğraflar da çoğalıyor ve big data kavramı önem kazanıyor. Bu da veri sayısının her geçen gün artması anlamına geliyor. Peki bu kadar çok verinin olması, bu veriler işlenmeden bir şey ifade ediyor mu?
Veri madenciliği kavramını daha iyi anlayabilmek ve bu konu hakkında fikir sahibi olabilmek için öncelikle, veri, enformasyon ve bilgi kelimelerinin anlamlarını hatırlamak ve bu çerçevede veri madenciliğini tanımlamak doğru olacaktır.
Veri, en genel tanımıyla ham, işlenmemiş kayıt anlamına gelir. Bu kayıtlar üzerinden yorum yapılabilir ancak net bir bilgiye ulaşmak mümkün olmaz. Örneğin; kişi isimleri, telefon numaraları, not ortalaması gibi kavramlar tek başlarına veridir.
Enformasyon ise, verilerin organize edilmesi ve sınıflandırılması sonucunda elde edilen bilgi parçaları olarak ifade edilebilir. Yani bir nevi veri anlamlandırılır ve ortaya enformasyon çıkar denilebilir. Örneğin; son beş yılda doğan bebeklerin isimleri, son bir yılın not ortalaması gibi kavramlar enformasyondur.
Enformasyona dönüştürülmüş verilerin analiz ve sentezlenmesi sonucunda anlam kazanması ise bilgi olarak tanımlanır. Bilgi, karar verme sürecinde etkilidir. Örneğin; son üç yılda, Ayşe isimli bebeklerin önceki yıllara göre iki kat artışta olduğuna dair bir söylem, bilgi olarak değerlendirilir.
Veri Madenciliği Nedir?
Sadece tek bir günde dahi dünya üzerinde birçok veri elde edilir. Bu verilerin bir kısmı enformasyon ve bilgiye dönüşme noktasında anlam ifade ederken, bir kısmı ise işlevsizdir. Yani verilerin anlamlı hale getirilmesi ve kullanılabilmesi için işlenmeleri gerekir. Milyonlarca veriye sahip yazılım sistemlerinin, kıymetli verileri elde etmek üzere yaptığı çalışmalara veri madenciliği denir. Veri madenciliği ile eldeki veriler arasında bağlantı kurmak ve sonraki süreçlerde bu veriler üzerinden tahminde bulunmak mümkün olabilmektedir.
Veri madenciliğinin temel amacı, kurumların ve kişilerin işine yarayabilecek ve bir gelişme sağlayabilecek verileri, işlevsiz verilerden ayırarak, belirli yöntemler ile işlemek ve kullanılabilir hale getirmektir.
Veri Madenciliği Süreci Nasıl İşler?
Veri madenciliği, ulaşılmak istenen bilginin büyüklüğü ve bunun için gereken işlemlere göre farklılık gösterse de genel olarak şu şekilde gerçekleşir:
- İlk olarak veri yığını tespit edilir ve bu yığının güvenliği sağlanır.
- Verilerden işe yaramayan ve anlam ifade etmeyenleri temizlenir.
- Elde kalan veriler bütünleştirilir, dönüştürülür.
- Veri madencileri, eldeki verilere uygun olan kümeleme, karar destek ağacı, sınıflandırma gibi yöntemlerle verileri gruplandırır.
- Elde edilen sonuçlar, test edilir ve sonuçlar değerlendirilir.
Hangi Alanlarda Uygulanır?
Günümüzde neredeyse tüm sektörlerin teknolojik altyapılar kullanmaya başlamasıyla birlikte veri madenciliği de değer kazanmış ve kullanım alanları oldukça gelişmiştir. Son yıllarda hem dünyada hem de ülkemizde nerdeyse her alanda ve sektörde veri madenciliği yapılmaktadır. Nerdeyse her an bilgisayar, tablet ya da telefonlarımız ile iç içe olduğumuz bir hayat yaşıyoruz. Hem işte hem de özel hayatımızda sık sık internet ortamında zaman geçiriyor ve arama motorları üzerinden birçok anahtar kelime ile araştırmalar yapıyoruz. İşte yapılan tüm bu aramalar, bir veri madencisi aracılığıyla analiz ediliyor. Sonraki süreçte de pazarlama şirketlerinin incelediği bu veriler sayesinde, hangi reklamların yapılacağı, hangi ürünlerin size gösterileceği ya da promosyona gireceği gibi satış stratejileri oluşturuluyor.
Her sektörde olduğu gibi bankacılık sektöründe de verilerin gücünden faydalanılıyor. Veri madenciliği sayesinde; kullanıcıların davranışları ya da alışkanlıkları analiz edilip, kullanıcıların daha kolay ve hızlı ödeme yapabileceği araçlar oluşturulabiliyor. Banka müşterilerine; etkili tasarruf yöntemleri, daha az zamanda daha hızlı işlem yapma, ihtiyaçlara anında cevap veren müşteri ilişkileri deneyimi yaşatma gibi kaliteli hizmetler sunulabiliyor.
Veri Madenciliğinin Faydaları Nelerdir?
- İnternet üzerinde yapılan ve tek başına hiçbir şey ifade etmeyen işlemler, anlamlandırılarak değerli bilgilere dönüşebilir ve gelecekte birçok alanda insanların ihtiyaçlarına cevap veren ürün ve hizmetler yapılabilir.
- İnternet kullanıcıların satın alma alışkanlıkları hakkında fikir sahibi olunabilir ve yeni bir ürün ya da hizmet oluşturulduğunda bunların hangi kitleye hitap edeceği konusunda bir öngörü oluşur. Böylece, piyasaya yeni bir ürün sürdüğünüzde, öncesinde bu ürünü pazarlayacağınız hedef kitleyi analiz etmiş olursunuz.
- Daha kaliteli ve müşteri odaklı hizmet anlayışı gelişir. Hem satıcı hem de alıcının memnun olduğu bir satış süreci yaşanabilir.
- Mevcut hedef kitle analizleri baz alınarak, satış tahminleri yapılabilir. Bu da riski azaltabilir.- Bankacılık sektöründe, kredi kartı harcamaları incelenerek müşteriler bu noktada kredi kartı kullanım alışkanlıklarına göre gruplandırılabilir.
Veri Madenciliği Yapabilmek İçin Gereken Özellikler Nelerdir?
Veri madencisi olmak için teknolojiyi takip etmek hatta teknolojiyi sadece kullanmaktan ziyade, teknolojik altyapılar kurmak için gerekli donanımları öğrenmek oldukça önemlidir. Yazılım, matematik, istatistik gibi alanlara ilgi duymak, analitik düşünebilmek ve problem çözme yeteneğine sahip olmak da gerekir. Siz de kendinizi bu konularda geliştirerek, geleceğin yükselen mesleklerinden biri olan veri madenciliği alanında uzmanlaşabilirsiniz.