ServiceCore
ServiceCore
AICore · Araç
Beta · Yol Haritası

RootCoreAI

Kayıt, log ve alarmları analiz ederek olayları akıllıca gruplar.

Sistemdeki tüm kayıtları, logları ve alarmları analiz ederek ilişkili olayları akıllı şekilde gruplar; kök neden analizi yaparak sorunların çözümünü hızlandırır. Aday kök nedenleri açıklanabilir bir kanıt zinciriyle sunar, onaylanan bulguyu 'known error' olarak kaydeder ve kalıcı çözüm için değişiklik talebine zemin hazırlar.

NE YAPAR
01

Incident, alarm, log, change ve CMDB sinyallerini tek bir korelasyon çizelgesinde birleştirir.

02

Olası kök nedenleri güven yüzdesiyle sıralar, en yükseğin kanıt zincirini açıklanabilir biçimde sunar.

03

Onaylanan kök nedeni 'known error' olarak kaydeder ve kalıcı çözüm için değişiklik talebi açabilir.

RootCoreAI · ÇALIŞIRKEN
KORELASYON ÇİZELGESİ · INC-2847
Birikim · 20 dk pencere
6 SİNYAL KORELE EDİLDİ5 kaynakcanlı
08:54
ALARMSRV-MAIL-01
CPU eşik üstü
5 dakikalık ortalama %85 → uyarı seviyesi
09:00
LOGExchange Transport
Queue depth tırmanıyor
7.512 mesaj · 60 sn'de +1.200
09:07
ALARMSRV-MAIL-01
Failover eşiği aşıldı (8.000)
Otomatik yedeğe geçiş bekleniyordu ama tetiklenmedi
09:11
CMDBqueue_threshold
Konfigürasyon kaydı eski
Son güncelleme CHG-1102 · 3 gün önce
09:14
INCİDENTINC-2847İNCELENEN OLAY
Posta sunucusu yanıt vermiyor
Şube ekipleri etkilendi · Selin Yıldız L1
09:16
INCİDENT+6 dublike
MergeCoreAI 6 kaydı INC-2847'ye bağladı
13 dk içinde 7 şube
KÖK NEDEN ADAYLARI
3 aday
Kuyruk geçiş eşiği yanlış konfigüre
queue_threshold = 8000 · CHG-1102 sonrası
87%
SRV-MAIL-01 disk I/O kontentüsü
STORE-IST-12
34%
DNS çözümleme gecikmesi
DNS-INT-01
18%
KANIT ZİNCİRİ
87% güven
Kuyruk geçiş eşiği yanlış konfigüre
queue_threshold = 8000 · CHG-1102 sonrası
1

Aktif kuyruk ortalaması 12.000 mesaja yakın seyrediyor — eşik bunun çok altında.

2

CHG-1102 (3 gün önce) bu parametreyi 5000 → 8000'e çıkardı, gerekçesi 'gürültü azaltma'.

3

Failover alarmı tam eşik anında 09:07'de tetiklendi ama yedek geçiş tetikleyici çalışmadı.

4

Aynı parametre ile son 7 günde 4 incident yaşandı (INC-2847 + 3 önceki).

BU ÇEYREK · ROOTCORE
KORELASYON
2.184sinyal
KÖK NEDEN
471otomatik
MTTR KAZANCI
38%↓ 22 dk
TEKRAR
−54%known error

Sahnede sentetik kurum ve kayıt verisi kullanılmıştır.

NASIL ÇALIŞIR
01
Çok kaynaklı toplama

Olay, log, alarm, son değişiklik ve CMDB verisi 20 dakikalık pencere içinde sıralanır.

02
Zaman + nedensellik

Sinyaller arası gecikme ve etki yönü modellenir, koreleli olanlar gruplanır.

03
Aday üretimi

Etkilenen varlık ve değişiklik geçmişi kullanılarak 3 olası kök neden çıkarılır.

04
Kanıt zinciri

Her aday için ölçüm, log ve geçmiş tekrar oranlarıyla beslenen 4-5 maddelik gerekçe sunulur.

HANGİ MODÜLLERDE ÇALIŞIR
SAHADAN SENARYO
Birikim Holding
DURUM

INC-2847 yine posta kuyruğunda biriken mesajla başladı; alarm, log ve incident sinyalleri farklı ekranlardaydı, kimse 3 gün önce yapılmış CHG-1102 değişikliğiyle bağlantıyı kuramıyordu.

SONUÇ

RootCoreAI 20 dakikalık pencerede 6 sinyali korele etti, kuyruk geçiş eşiğinin CHG-1102 sonrasında yanlış konfigüre edildiğini %87 güvenle çıkardı; gerekçeyi 4 maddelik kanıt zinciriyle yöneticiye sundu. Kök neden 'known error' olarak kaydedildi, CHG-1148 ile kalıcı çözüm planlandı. Aynı sorun bir daha tekrarlamadı.