Anasayfa / Genel bir bakış / Bir Süreç Madenciliği Aracı: DISCO

Bir Süreç Madenciliği Aracı: DISCO

DISCO Nedir?

DISCO, Fluxicon’un bir projesi olarak süreç madenciliği alanı için geliştirilen otomatize araçtır. DISCO projesinin hayata geçmesini sağlayan DR. Anne Rozinat ve DR. Christian W.Günther DISCO yazılımını “Ham verilerden işleminiz hakkında 5 dakikadan daha kısa sürede görsel ve kullanılabilir bilgiler sunu” mottosu ile geliştirmiş ve piyasaya sürmüştür.

DISCO Süreç madenciliği çalışmalarının kısa sürede daha çok görselle anlaşılabilirliğini arttırmayı hedefleyen bir yazılımdır. DISCO’nun en belirgin özellikleri, performansı optimize etmek, sapmaları kontrol etmek veya varyasyonları keşfetmek olarak sıralanabilir.

DISCO’nun Fonksiyonları

· İçe Aktarma(Import):

Süreç madenciliği projeleri verilerin analiz edilmesi amacıyla başlatılır. DISCO’nun dışarıdan aktarma fonksiyonu sayesin analiz etmek istenilen verilerin zaman damgalarını otomatik olarak algılanır ve yapılandırma ayarları hatırlanarak kolay bir şekilde içe aktarılır.

Basitçe bir CSV veya Excel dosyasını açın ve sütunların vaka kimliğini, zaman damgalarını ve etkinlik kayıtlarını yapılandırılması yeterlidir. Eklemek istenilen başka öznitelikler de analize eklenebilir.

1. Sütunları seç.

2. Ayarla.

3. İçeri Aktar.

DISCO, ProM 5 ve ProM 6 akademik araç setleri ile tamamen uyumludur. Olay günlüğü standart formatları MXML ve XES gibi formatlar kullanıcılar tarafından sorunsuz bir şekilde konfigüre edilebilir.

DISCO, yerel FXL DISCO günlük dosyası formatı üzerinden çok büyük veri setleri için 200x’e kadar hızlandırma özelliği ile daha önce içe aktarılan veri kümeleri için içe aktarma ve veri değişimi özelliğine sahiptir.

Verinin içe aktarılmış hali aşağıdaki gibi gösterilmektedir.

· Otomatik Süreç Keşfi (Automated Process Discovery)

Süreç madenciliğinin esas işlevi, içe aktarılan günlük dosyanızdaki faaliyet dizilerini yorumlayarak işlem haritalarının otomatik olarak keşfedilmesidir. Yüklemeyi başlat düğmesine tıkladıktan sonra, hızlıca ve objektif olarak işleminizin gerçekte nasıl yapıldığını görebileceğiniz harita görünümüne doğru yönlendirilinir.

DISCO, sezgisel olarak anlaşılır ve %100 doğru süreç haritası görselleştirmesi kullanır. Süreç yollarının kalınlığı ve aktivitelerin renklenmesi süreç akışlarının ana yollarını gösterir ve aşağıdaki satın alma örneği sürecinde gözüktüğü gibi yeniden işleme döngüleri hızlıca keşfedilir.

DISCO Madencisi, Christian’s madencisini temel almaktadır, ancak birçok yönden daha geliştirilmiştir.

Fuzzy Miner, kesintisiz süreç basitleştirmesi, sık yapılan faaliyetlerin ve yolların vurgulanması gibi gelişmiş özellikler de dahil olmak üzere, süreç madenciliğini işlemek için “harita metaforu”nu sunacak ilk madencilik algoritmasıydı. DISCO için Fuzzy Miner bilimsel olarak kanıtlanan yaklaşımı kullanılır.

Sonuç olarak, karmaşıklığa sahip veri setleri için güvenilir sonuçlar verirken süreç madenciliğini daha önce hiç tecrübesi olmayan kişiler için daha verimli bir şekilde işlenebilen ve anlaşılabilen bir hal getirmiştir. DISCO Süreç Madencisi etkin bir şekilde yeni nesil Fuzzy Mining yapan, tamamen yeni süreç ölçütleri ve modelleme stratejileri ile geliştirilmiştir.

DISCO Süreç Madenciliği yazılımını diğerlerinden ayıran özellikleri:

· Kullanılabilirlik: DISCO Süreç madenciliği yazılımı, alanında uzman kişilerin kolayca anlayabileceği ve yönetebileceği bir tasarım ile geliştirildi. Ayrıca aşırı yüklenmeyi önlerken, görselleştirmelerin geniş bilgi kapasitelerini kaldırabilecek şekilde tasarlanmıştır. DISCO modellerinin okunması ve anlaşılması, kolay olmasını sağlamak için son teknoloji ürün UX ve görselleştirme araştırmaları ve kullanıcı tavsiyeleri dikkate alınmıştır.

· Uygunluk: Basit, iyi yapılandırılmış bir süreç modelinden doğru model oluşturmak kolaydır. Ancak, karmaşık verilerle karşı karşıya kalındığında, çoğu ticari yaklaşım, model karmaşıklığını kontrol altında tutmak için kullanılan veriler( yalnızca ana varyantları kullanarak) büyük ölçüde sınırlanmaktadır. DISCO işlemin en önemli parçalarını tüm veri kümesinden zekice ayıklayabilir ve karmaşık verilerden yararlı bir model oluşturur.

· Performans: Bir çok süreç madenciliği araçları prosedürel bir biçimde kullanılmak istenmektedir. Veriler verildikten sonra bazı parametreler ile süreç modeli oluşturulur. DISCO süreci birden fazla perspektiften hızlı bir şekilde aramak suretiyle veriyi anlamayı öğrenir. Bu yaklaşım sebebiyle süreç madenciliği yazılımı hızlı olmak zorundadır.

DISCO Süreç madenciliği yazılımı, saniyeler içinde karmaşık verilerden bir bütün ortaya çıkartma kabiliyeti, verinin görselleştirilmesi ve bu işlemleri gerçekleştirme hızı sebebiyle diğer yazılımlar yerine tercih edilmiştir.

Süreç İstatistikleri

İşlem haritalarının yanında işleminizle ilgili istatistikleri de incelenebilir. Bunun için, araç çubuğundaki istatistikler sekmesine geçebilirsiniz. Veri setinizdeki olaylar ve etkinliklerin sayısı, kapsanan zaman aralığı ve aşağıda gösterilen olay takımı sürümü çizelgesi gibi performans grafikleri hakkında genel bilgi edinilebilir.

Sol taraftaki diğer istatistik görüntüleri, işlemler hakkında tüm etkinlikler ve kaynaklar için frekans ve performans bilgisini vermektedir. Ayrıca, veri kümenize eklediğiniz ek veri öznitelikleri sütunlarına ilişkin istatistikleri de görülebilir.

Ek veri özellikleri, süreç analizleri için önemlidir, çünkü aşağıdakiler gibi ilgili içeriğe sahiptirler:

· IT Hizmet sürecinde bir değişiklik isteğinin hangi kategoriye girdiği.

· Satış sürecinde lider etkeninin girdiği kanal.

· Bir hizmet sürecinde garanti ve garanti dışı yapılan onarım gibi alan adlarına özgü özellikler.

· Faaliyetlerin hangi bölüm tarafından ele alındığı.

· İşlemlerin hangi ülkede gerçekleştirildiği.

· Birçok satın alma işlemi ile ilgili bir siparişin değeri, çünkü sahtecilikle ilgili farklı kurallara uyan para miktarına bağlı sahtekarlıkla mücadele kuralları uygulanır.

Varyasyon ve Bireysel Olaylar

Üçüncü kısım, olaylar(Cases) sekmesidir. Harita görünümü işlem akışlarıyla ilgili bir bilgi verirken istatistik görünümü, işleminizle ilgili ayrıntılı performans metrikleri sunar; durumlar görünümü, gerçekte her bir durum düzeyine iner ve size ham verileri göstermektedir.

Tek tek vakaları incelemek önemlidir, çünkü bulguları doğrulamanız ve özellikle süreç analizi sırasında keşfedeceğiniz “garip” davranış için somut örnekler bulmanız gerekecektir. Vaka sayısına dikkat çekip, bunun gerçekten de operasyonel sistemde olduğunu doğrulayana kadar neredeyse her zaman inanması, kanıtlanması zor olan şeyleri bulacaksınız.

Ayrıca geçmişleri ve nitelikleri ile bireysel vakalara bakmak bazen bir şeylerin nedenini açıklayan ek bağlam (örnek olarak, bir açıklama alanı) verilebilir. Son olarak, analizlerinize göre hareket edebilmek için bireysel vakalara kadar ayrıntılı bilgi edinebilmek önemlidir. Örnek olarak açıklanan sürecin sapmalarını veya önemli bir ticari kuralın ihlalini tespit ettiyseniz, bu davaların bir listesini almak ve ek eğitim sağlamak için ilgili kişilerle konuşmak istenilebilir. Bu bir olası durum örneğidir.

Veri kümesindeki tüm vakaların tam bir listesine ek olarak, işleminizdeki varyantlara da doğrudan erişilebilinmektedir. Varyantlar, süreç analizinin ayrılmaz bir parçasıdır. DISCO’da bir varyant belirli bir etkinlik dizisidir. İşlemi başından sonuna kadar bir yol olarak kabul edilebilir. İşlem haritasında, faaliyetler arasındaki sürecin akışına genel bir bakış, tüm vakalar için birlikte gösterilir. Bir varyant daha sonra döngülerin açıldığı başlangıçtan durma sembolüne kadar bu süreç boyunca çalıştırılır.

Genellikle, veri kümelerindeki durumların büyük bir kısmı yalnızca birkaç değişkeni izlemektedir. Örnek olarak, yukarıda gösterilen satın alma işleminde, en çok kullanılan, en sık görülen varyantlar. Tüm vakaların %50’si, ancak toplam 98 farklı varyant mevcuttur.

Ayrıca, vaka adları ve tüm etkinlik, kaynak ve veri sütunlarında canlı tam metin arama, aradığınız kelimeleri veya kelimeleri temel alan belirli durumlarda bulmanızı sağlar.

Filtreleme

DISCO, keşif amaçlı incelemeler yapmak ve analizinizi odaklamak için size güçlü, yıkıcı olmayan filtreleme özellikleri sunmaktadır. Bu filtreler her açıdan hızlı erişilebilir ve kolay anlaşılırdır.

Örnek olarak aşağıda gösterilen performans filtresi, işlem hacmine göre vakaları filtrelemenize olanak sağlar. Alt sürgü kontrolü sürükleyerek, sadece 70 günden uzun süren vakalara odaklanabilinir. Pasta grafik göstergesi, geçerli seçimin veri kümesindeki vakaların yaklaşık %15’ini içerdiğini bildirmektedir. Filtreyi uyguladığınızda, tüm analiz görünümler (Harita, istatistik ve kılıflar) yalnızca şu anda incelediğiniz bu %15’lik kısım gösterilecektir.

DISCO’da toplamda altı adet güçlü filtre türü vardır ve bunlar herhangi bir sırayla birleştirilebilir ve istiflenebilirler.

· Zaman aralığı filtresi, sezgisel takvim denetimleriyle, bir zaman penceresine dayalı olayları ve bu olayların seçimi için filtre uygular. Bir işlem değiştirmeden önce ve sonra işlemleri karşılaştırmak için kullanılabilir.

· Varyasyon filtrelemesi, varyasyonlar görünümündeki varyantlardan faydalanarak, analizinizi ana akış davranışına veya tam olarak istisnai durumlara odaklanmanıza olanak tanımaktadır.

· Performans filtresi, yukarıda gösterilen örnekte ki gibi durum süreleri ve çeşitli performans metriklerine dayalı vakalara odaklanır.

· Son nokta(Endpoint) filtresi, başlangıç ve bitiş faaliyetlerine dayalı vakalar seçmek için kullanılır. Örnek olarak, işlemin bir bölümünü kesmek için bitirilmemiş olaylar filtrelenebilir.

· Özellik(Attribute) filtresi, veri niteliklerine dayalı belirli etkinlikleri, kaynakları veya süreç kategorilerini temel alarak filtreleyebilir.

· Takipçi filtresi, görev ihlallerinin ayrımını kontrol etmek için kullanılabilecek 4-Gözlü filtre seçeneği de dahil olmakla beraber güçlü süreç-desen odaklı filtre özelliğidir.

Üç analiz görüşüyle birlikte bu filtreleme özellikleri, sürecinizi çok yönlü olarak hızlı ve etkileşimli bir biçimde keşfedilmesine ve işlemle ilgili somut sorunların cevaplanmasına olanak tanır. DISCO ve programın filtreleme özellikleri genel olarak çok hızlı olduğu için siz ve bir grup diğer süreç paydaşlarını bir araya getirerek AS-IS analizi yapmak ve süreçlerin iyileştirme fikirlerini üretmek için interaktif süreç atölyeleri düzenlenebilmektedir.

Performans Vurguları

Frekansa dayalı işlem haritasına ek olarak, süreçte harcanan zaman da analiz edilebilmektedir. Faaliyetlerin süreleri ve faaliyetler arasındaki pasif(bekleme) süreleri otomatik olarak veri setindeki zaman damgalarından çıkarılır ve süreç haritasına görsel olarak yansıtılmaktadır.

Örnek olarak yukarıda 70 günün üzerinde geçen vakaların alt kümesi için, işlem haritasında kaybolan zamanın çoğunun bulunduğu performans vurgulamasından görülebilir. Özellikle, tırnak talebini değiştirme işini, değiştirme etkinliğindeki genel tekrar işleme döngüsü ortalama 15 gün sürmektedir ve genellikle birden çok kez gerçekleştirilmektedir.

Alternatif toplam süreler performans vurgulama seçeneği, her etkinlik için süreleri ve tam veri seti için yolu toplama suretiyle, bu yükseklikte etkili alanları tek seferde gösterebilmektedir.

Animasyon

Animasyon, keşfedilen süreç haritasında doğru zamanla sürecin akışının gösterilmesinin bir yoludur. Animasyon simülasyonu ile karıştırılmamalıdır. Taklit etmek yerine, günlükteki gerçek olaylar, keşfedilen işlem haritasında gerçekleştikçe tekrarlanmaktadır.

Animasyon, süreç analizi uzmanları takımına sahip olmayan, süreç yöneticilerine veya diğer kişilere analiz sonuçlarını iletmek için oldukça faydalı bir özelliktir. Veri kümesindeki olayların süreç boyunca nasıl (gerçek hızlarıyla) hareket ederek gösterildiğinde, süreç tam anlamıyla hayata geçirilmiş olur.

Animasyon görseldeki gibi gerçekleştirilmektedir. Animasyon süreleri çok uzun olabildiği için kırmızı ile belirtilen alandan animasyonun gösterim hızını arttırabilir veya azaltabilirsiniz. Yukarıda belirtilen görsel de satın alma sürecinde keşfedilen ve 70 günden uzun süren vakalar için işlem haritasındaki performans metriklerini analiz edilen tıkanıklığı gözler önüne sermektedir.

Her sarı nokta, süreç boyunca halen hareket eden bir olay olup, tıkanıkların nereye yığıldığına bakara somutlaştırmaktadır.

Proje Yönetimi

DISCO programının avantajlarından biri, bir proje görünümünde birden fazla veri setinin yönetimi aracılığı ile projenin desteklenebilmesidir. Tipik bir süreç madenciliği projesinde, günlük dosyalar farklı yollarla içe aktarılabilmektedir ve bunlar filtrelenebilir veya ara sonuçları kaydetmek için kopyalar alınabilmektedir. Bu, birçok farklı sürüm ve veri kümelerinin görünümüyle sonuçlanır, bu sonuçlar kolayca elden çıkarılabilir.

DISCO programındaki proje görünümü, genel bir bakış sağlanabilmesi için mevcuttur. Tüm çalışmaları tek bir yerde tutar ve bulunanlar veya proje hakkında açıklamalar yapmak için notlar oluşturmanıza izin vermektedir. Bütün projeler ihraç edilebilir ve bıraktığınız yerden tekrar başlayabilirsiniz. Aynı zamanda birden fazla kişiyle de paylaşılabilir.

Yukarıdaki görselde kırmızı ile gösterilen alana tıklandığı zaman projenin detaylarına ulaşabilirsiniz.

Kaynakça

*http://fluxicon.com/disco/

http://fluxicon.com/disco/files/Disco-User-Guide.pdf

Hakkında Veri Bilimi OKULU

GÖZ ATMAK İSTEYEBİLİRSİNİZ

Veri Analizi – E-ticaret Uygulaması

Merhaba VBO okuyucuları! Bu yazımda, e-ticaret örnek verisi üzerinden veri analizi uygulaması yapacağız. Bir önceki …

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir