Markov karar süreci (MDP), ayrık zamanlı stokastik bir kontrol sürecidir. Sonuçların bazen rastgele bazen de karar verenin kontrolünde olan durumlarda karar vermeyi matematiksel olarak inceler. Dinamik programlama ve pekiştirmeli öğrenme ile çözülen optimizasyon problemlerinde kullanılır. Markov karar süreci araştırmalarının temellerinin büyük bir kısmı 'ın 1960 yılında basılan Dinamik Programlama ve Markov Süreçleri (Dynamic Programming and Markov Processes) adlı kitabında atılmıştır.Robotik, ekonomi, üretim gibi farklı alanlarda kullanılır. İsmini (Markov zincirinin) mucidi Rus Matematikçi Andrey Markov'dan alır.
Kaynakça
- ^ Howard, Ronald A. "Dynamic Programming and Markov Processes" (PDF). The M.I.T. Press. 9 Ekim 2011 tarihinde kaynağından (PDF). Erişim tarihi: 2 Mayıs 2020.
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar