Bilgisayarlı görü, bilgisayarların dijital görüntülerden veya videolardan nasıl bir anlam kazanabileceğiyle ilgilenen disiplinler arası bilimsel bir alandır. Mühendislik yöntemleriyle, insan görsel sisteminin yapabileceği görevleri anlamaya ve otomatikleştirmeye çalışmaktadır.
Bilgisayarlı görü görevleri, sayısal veya sembolik bilgi üretmek için dijital görüntüleri elde etme, işleme, analiz etme ve anlamayı içermektedir. Aynı zamanda gerçek dünyadan yüksek boyutlu verilerin çıkarılmasına yönelik yöntemleri içermektedir. Buna göre anlamak, görsel imgelerin (retinanın girdisi) düşünce süreçlerin anlamlandıran ve uygun eylemi ortaya çıkarabilen dünya tanımlarına dönüşümü anlamına gelmektedir.
Bilgisayarlı görünün bilimsel disiplini, görüntülerden bilgi çıkaran yapay sistemlerin arkasındaki teori ile ilgilidir. Görüntü verileri; video parçaları, birden çok kameradan gelen görüntüler, bir 3B tarayıcıdan çok boyutlu veriler veya tıbbi tarama cihazından gelen görüntüler gibi birçok biçimde olabilmektedir. Bilgisayarlı görü vizyonunun teknolojik disiplini, teorilerini ve modellerini bilgisayarla görme sistemlerinin yapımına uygulamayı amaçlamaktadır.
Bilgisayarlı görünün alt alanları nesne algılama, olay algılama, video izleme, nesne tanıma, 3D poz tahmini, öğrenme, indeksleme, hareket tahmini, otomatik görsel oluşturma, 3D sahne modelleme ve görüntü onarımı gibi alanlardır.
Tanım
Bilgisayarlı görü, bilgisayarların dijital görüntülerden veya videolardan nasıl bir anlam kazanabileceğiyle ilgilenen disiplinler arası bilimsel bir alandır. Mühendislik yöntemleriyle, insan görsel sisteminin yapabileceği görevleri anlamaya ve otomatikleştirmeye çalışmaktadır. "Bilgisayarlı görü, tek bir görüntüden veya bir dizi görüntüden yararlı bilgilerin otomatik olarak çıkarılması, analizi ve anlaşılmasıyla ilgilidir. Otomatik görsel anlayışa ulaşmak için teorik ve algoritmadan türetilen bir temelin geliştirilmesini içermektedir". Bilimsel bir disiplin olarak bilgisayarlı görü, görüntülerden bilgi çıkaran yapay sistemlerin arkasındaki teori ile ilgilenir. Görüntü verileri, video parçaları, birden çok kameradan gelen görüntüler veya bir tıbbi tarayıcıdan gelen çok boyutlu veriler gibi birçok biçimde olabilmektedir. Teknolojik bir disiplin olarak bilgisayarlı görü, teorilerini ve modellerini bilgisayarla görme sistemlerinin inşası için uygulamaya çalışmaktadır.
Tarihçe
1960'ların sonlarında, yapay zekaya öncülük eden üniversitelerden bilgisayarlı görü ile ilgili çalışmalar başlatıldı. Robotlara akıllı davranışlar kazandırmak için bir basamak olan insan görsel sistemini taklit ettirmek amaçlanıyordu. 1966'da bunun, bir bilgisayara bir kamera bağlatılarak ve "gördüklerini tarif etmesini" sağlatılarak bir ufak bir proje ile başarılabileceğine inanılıyordu.
Bilgisayarlı görüyü o dönemde yaygın olan dijital görüntü işleme alanından ayıran şey, tarama yapılan alanı tam olarak anlamak amacıyla görüntülerden üç boyutlu yapı çıkarma arzusuydu. 1970'lerde yapılan araştırmalar, görüntülerden kenarların çıkarılması, çizgilerin etiketlenmesi, çok yüzlü olmayan ve çok yüzlü modelleme, nesnelerin daha küçük yapıların ara bağlantıları olarak gösterilmesi, optik akış ve hareket tahmini gibi bugün var olan bilgisayarlı görü algoritmalarının birçoğunun ilk temellerini oluşturdu. Daha sonraki on yıl, bilgisayar vizyonunun daha titiz matematiksel analizine ve nicel yönlerine dayanan çalışmalar görüldü. Bunlar arasında ölçek alanı kavramı, gölgeleme, doku ve odak gibi çeşitli ipuçlarından şekil çıkarımı ve yılanlar olarak bilinen kontur (Resimde nesneyi belirgin gösteren çevre çizgisi.) modelleri yer aldı. Araştırmacılar ayrıca, bu matematiksel kavramların çoğunun, düzenlileştirme ve Markov rastgele alanları ile aynı optimizasyon çerçevesi içinde ele alınabileceğini fark etmişlerdir. 1990'larda, önceki araştırma konularından bazıları diğerlerinden daha aktif hale geldi. Projektif 3-D onarım araştırmaları, kamera kalibrasyonunun daha iyi anlaşılmasına yol açmıştır. Kamera kalibrasyonu için optimizasyon yöntemlerinin ortaya çıkmasıyla birlikte, fotogrametri alanından demet ayarlama teorisinde birçok fikrin keşfedildiği fark edilmiştir. Bu, birden çok görüntüden sahnelerin seyrek 3 boyutlu onarımı için farklı yöntemlere yol açmıştır. Yoğun üç boyutlu uygunluk problemi ve daha fazla çoklu-görüntülü üç boyutlu tekniklerinde ilerleme kaydedildi. Aynı zamanda, görüntü ayırmayı çözmek için grafik kesiminin varyasyonları kullanıldı. Bu on yıl içinde, görsellerdeki yüzleri tanımak için istatistiksel öğrenme tekniklerinin ilk kez pratikte kullanılmıştır (Örneğin Eigenface). 1990'ların sonlarına doğru, bilgisayar grafikleri ve bilgisayar görüşü alanları arasındaki etkileşimin artmasıyla önemli bir değişiklik meydana gelmiştir. Bu, görüntü tabanlı oluşturma, görüntü dönüştürme, görünüm enterpolasyonu, panoramik görüntü birleştirme ve erken ışık alanı oluşturmayı içeriyordu.
Son zamanlarda yapılan çalışmalar, makine öğrenimi teknikleri ve karmaşık optimizasyon çerçeveleri ile birlikte kullanılan özellik tabanlı yöntemlerin yeniden canlandığını gördü.Derin Öğrenme tekniklerinin ilerlemesi, bilgisayarlı görü alanına daha fazla yenilik getirdi. Sınıflandırma, segmentasyon ve optik akış gibi çeşitli görevler için çeşitli karşılaştırmalı bilgisayarlı görü veri setlerinde derin öğrenme algoritmalarının doğruluğu önceki yöntemleri geride bırakmıştır.
İlgili alanlar
Katı hal fiziği
Katı hal fiziği, bilgisayarlı görü ile yakından ilgili olan başka bir alandır. Çoğu bilgisayarlı görü sistemi, tipik olarak görünür veya kızılötesi ışık şeklinde olan elektromanyetik radyasyonu algılayan görüntü sensörleri ile çalışmaktadır. Sensörler, kuantum fiziği kullanılarak tasarlanmıştır. Işığın yüzeylerle etkileşime girdiği süreç fizik kurallar kullanılarak açıklanmaktadır. Fizik, çoğu görüntüleme sisteminin temel bir parçası olan optiğin davranışını açıklar. Gelişmiş görüntü sensörleri, görüntü oluşum sürecini tam olarak anlamak için kuantum mekaniğine bile ihtiyaç duymaktadır. Ayrıca, fizikteki çeşitli ölçüm problemleri, örneğin sıvılarda hareket gibi bilgisayarlı görü kullanılarak ele alınabilmektedir.
Sinir bilimi
Önemli bir rol oynayan ikinci bir alan, sinir bilimi, özellikle biyolojik görü sistemi çalışmasıdır. Geçen yüzyılda, hem insanlarda hem de çeşitli hayvanlarda görsel uyaranların işlenmesi için çalışan gözler, nöronlar ve beyin yapıları üzerinde kapsamlı bir çalışma yapılmıştır. Bu, görme ile ilgili belirli görevleri çözmek için "gerçek" görüntü sistemlerinin nasıl çalıştığına dair kaba, ancak karmaşık bir açıklamaya yol açmıştır. Bu sonuçlar, yapay sistemlerin, biyolojik sistemlerden farklı karmaşıklık düzeylerinde işlenmesine yol açmıştır. Aynı zamanda davranışları taklit edecek şekilde tasarlandığı bilgisayarlı görü içinde bir alt alana yol açmıştır. Ayrıca, bilgisayarlı görü içinde geliştirilen öğrenmeye dayalı yöntemlerden bazıları (örneğin; sinir ağı, derin öğrenme tabanlı görüntü ve özellik analizi ve sınıflandırma) biyoloji geçmişine sahiptir.
Bilgisayarlı görü araştırmalarının bazı türleri, biyolojik vizyon araştırmalarıyla yakından ilgilidir. Aslında, yapay zeka araştırmalarının birçok türünün insan bilincine yönelik araştırmalarla ve görsel bilgileri yorumlamak, entegre etmek ve kullanmak için depolanan bilginin kullanımıyla yakından bağlantılı olması gibi örnekler verilebilmektedir. Biyolojik görme alanı, insanlarda ve diğer hayvanlarda görsel algının arkasındaki fizyolojik süreçleri inceler ve modeller. Bilgisayarlı görü ise yapay görme sistemlerinin arkasında yazılım ve donanımda uygulanan süreçleri inceler ve açıklar. Biyolojik ve bilgisayarlı görü arasındaki disiplinler arası alışveriş her iki alan için de verimli olmaktadır.
Sinyal işleme
Bilgisayarlı görü ilgili bir başka alan da sinyal işlemedir. Tek değişkenli sinyallerin, tipik olarak zamansal sinyallerin işlenmesine yönelik birçok yöntem, bilgisayarlı görüde iki değişkenli sinyallerin veya çok değişkenli sinyallerin işlenmesine doğal bir şekilde genişletilebilmektedir. Bununla birlikte, görüntülerin özel doğası nedeniyle, tek değişkenli sinyallerin işlenmesinde karşılığı olmayan, bilgisayarlı görü içerisinde geliştirilen birçok yöntem vardır. Sinyalin çok boyutluluğuyla birlikte, sinyal işlemede bilgisayar görüşünün bir parçası olarak bir alt alanı tanımlanmaktadır.
Robotik navigasyon
Robot navigasyonu, robotik sistemlerin bir ortamda gezinmesi için otonom yol planlaması veya düşüncesiyle ilgilenmektedir. İçlerinde gezinmek için bu ortamların ayrıntılı olarak anlaşılması gerekmektedir. Çevre hakkındaki bilgiler, bir görüntü sensörü görevi gören ve çevre ile robot hakkında üst düzey bilgi sağlayan bir bilgisayar görüntü sistemi tarafından sağlanabilir.
Diğer alanlar
Bilgisayarlı görü ile ilgili yukarıda bahsedilen görüşlerin yanı sıra, ilgili araştırma konularının çoğu tamamen matematiksel bir bakış açısıyla da incelenebilmektedir. Örneğin, bilgisayarlı görüdeki birçok yöntem istatistiklere, optimizasyona veya geometriye dayanmaktadır. Son olarak, alanın önemli bir kısmı bilgisayar vizyonunun uygulama yönüne ayrılmıştır; çeşitli yazılım ve donanım kombinasyonlarında mevcut yöntemlerin nasıl gerçekleştirilebileceği veya çok fazla performans kaybetmeden işlem hızı kazanmak için bu yöntemlerin nasıl değiştirilebileceği gibi alanlarla da ilgilenmektedir. Bilgisayarlı görü ayrıca moda e-ticaretinde, envanter yönetiminde, patent araştırmasında, mobilyada ve güzellik endüstrisinde de kullanılmaktadır.
Ayrımlar
Bilgisayarlı görü ile en yakından ilgili alanlar görüntü işleme, görüntü analizi ve makine görüsüdür. Bunların kapsadığı çeşitli teknikler ve uygulamalar arasında önemli bir benzerlik vardır. Bunun anlamı, bu alanlarda kullanılan ve geliştirilen temel tekniklerin benzer olduğunu, farklı isimlere sahip tek bir alan olduğu şeklinde yorumlanabilecek olduğunu ima etmektedir. Öte yandan, araştırma gruplarının, bilimsel dergilerin, konferansların ve şirketlerin kendilerini özellikle bu alanlardan birine ait olarak sunmaları veya pazarlamaları gerekli görünmektedir. Bu nedenle, her alanı diğerlerinden ayıran çeşitli nitelendirmeler olmuştur. Bilgisayar grafikleri, 3D modellerden görüntü verileri üretmektedir, bilgisayarlı görü genellikle görüntü verilerinden 3D modeller üretmektedir. Örneğin artırılmış gerçeklikte keşfedildiği gibi, iki disiplinin bir kombinasyonuna doğru bir eğilim vardır.
Aşağıdaki nitelendirmeler konuyla ilgili görünmektedir ancak evrensel olarak kabul edildiği gibi alınmamalıdır:
- Görüntü işleme ve görüntü analizi genellikle 2D görüntülere, bir görüntünün diğerine nasıl dönüştürüleceğine, örneğin kontrast geliştirme gibi piksel bazlı işlemler, kenar çıkarma veya gürültü giderme gibi yerel işlemler veya görüntüyü döndürme gibi geometrik dönüşümlere odaklanma eğilimindedir. Bu tanımlandırma, görüntü işlemenin veya analizinin, ne varsayımlar gerektirdiğini ne de görüntü içeriği hakkında yorumlar üretmediğini ima etmektedir.
- Bilgisayarlı görü, 2D görüntülerden 3D görüntü analizini içermektedir. Bu, bir veya birkaç görüntü üzerine yansıtılan 3D sahneyi analiz eder, örneğin; 3D sahne hakkındaki yapının veya diğer bilgilerin bir veya birkaç görüntüden nasıl yeniden yapılandırılacağı ifade etmektedir. Bilgisayarlı görü genellikle bir görüntüde tasvir edilen sahne hakkında az çok karmaşık varsayımlara dayanmaktadır.
- Makine görüsü, endüstriyel uygulamalarda görüntüleme tabanlı otomatik inceleme, süreç kontrolü ve robot rehberliği sağlamak için bir dizi teknolojiyi ve yöntemi uygulama sürecidir. Makine görüsü, temel olarak üretimde, örneğin vizyon tabanlı robotlar ve görsel tabanlı inceleme, ölçüm veya toplama (çöp toplama gibi) sistemleri gibi uygulamalara odaklanma eğilimindedir. Bu, görüntü sensörü teknolojilerinin ve kontrol teorisinin genellikle bir robotu kontrol etmek için görüntü verilerinin işlenmesi ile bütünleştirildiği sonucu çıkarılmaktadır. Ayrıca gerçek zamanlı işlemenin donanım ve yazılımdaki verimli uygulamalarla vurgulandığı anlamına gelmektedir. Aynı zamanda, aydınlatma gibi dış koşulların, makine görüşünde genel bilgisayarlı görüde olduğundan daha fazla kontrol edilebileceğini ve genellikle daha kontrollü olduğunu ifade etmektedir. Bu da farklı algoritmaların kullanılmasını sağlayabileceğini ima etmektedir.
- Öncelikle görüntü üretme sürecine odaklanan, ancak bazen görüntülerin işlenmesi ve analizi ile ilgilenen görüntüleme adı verilen bir alan da vardır. Örneğin, tıbbi görüntüleme, tıbbi uygulamalardaki görüntü verilerinin analizine yönelik önemli çalışmaları içermektedir.
- Son olarak, örüntü tanıma, temel olarak istatistiksel yaklaşımlara ve yapay sinir ağlarına dayanan, genel olarak sinyallerden bilgi çıkarmak için çeşitli yöntemler kullanan bir alandır. Bu alanın önemli bir kısmı, bu yöntemlerin görüntü verilerine uygulanmasına ayrılmıştır.
Uygulama alanları
Uygulamalar, üretim hattında hızla ilerleyen şişeleri inceleyen endüstriyel makine görme sistemleri gibi görevlerden, yapay zeka ve çevrelerindeki dünyayı kavrayabilen bilgisayarlar veya robotlar üzerine araştırmalara kadar uzanmaktadır. Bilgisayarlı görü ve makine görüsü alanları önemli ölçüde örtüşmektedir. Bilgisayarlı görü, birçok alanda kullanılan otomatik görüntü analizinin temel teknolojisini kapsamaktadır. Makine görüsü genellikle, endüstriyel uygulamalarda otomatik inceleme ve robot rehberliği sağlamak için otomatik görüntü analizini diğer yöntem ve teknolojilerle birleştirme sürecini ifade etmektedir. Pek çok bilgisayarlı görü uygulamasında, bilgisayarlar belirli bir görevi çözmek için önceden programlanmıştır, ancak öğrenmeye dayalı yöntemler artık giderek yaygınlaşmaktadır. Bilgisayarlı görü uygulamalarının örnekleri aşağıdakilere yönelik sistemleri içermektedir:
- Otomatik inceleme, örneğin imalat uygulamalarında;
- İnsanları tanımlama görevlerinde yardımcı olmak, örneğin bir tür tanımlama sistemi;
- Kontrol süreçleri, örneğin bir endüstriyel robot;
- Olayları tespit etme, örneğin görsel izleme veya insan sayımı;
- Etkileşim, örneğin bilgisayar-insan etkileşimi için bir cihaza girdi olarak;
- Nesneleri veya ortamları modelleme, örneğin, tıbbi görüntü analizi veya topografik modelleme;
- Navigasyon, örneğin, otonom bir araç veya mobil robot yön bulma;
- Bilgilerin düzenlenmesi, örneğin görüntü veri tabanlarının ve görüntü dizilerinin indekslenmesi.
Sağlık
En önemli uygulama alanlarından biri, bir hastayı teşhis etmek için görüntü verilerinden bilgilerin çıkarılmasıyla bir sonuç elde eden tıbbi bilgisayarlı görü veya tıbbi görüntü işlemedir. Bunun bir örneği, tümörlerin veya diğer anormal değişikliklerin saptanmasıdır; organ boyutları, kan akışı vb. ölçümleri başka bir örnektir. Aynı zamanda yeni bilgiler sağlayarak tıbbi araştırmaları desteklemektedir: örneğin beynin yapısı veya tıbbi tedavilerin kalitesi hakkında. Tıbbi alandaki bilgisayarlı görü uygulamaları, örneğin gürültünün etkisini azaltmak için insanlar tarafından yorumlanan ultrasonik görüntüler veya X-ışını görüntüleri tarafından yorumlanan görüntülerin geliştirilmesini de içermektedir.
Makine görüsü
Bilgisayarlı görüdeki ikinci bir uygulama alanı, makine görüsü olarak adlandırılan ve bir üretim sürecini desteklemek amacıyla bilginin çıkarıldığı endüstridir. Bir örnek vermek gerekir ise, kusurları bulmak için ayrıntıların veya nihai ürünlerin otomatik olarak incelendiği kalite kontrolüdür. Bir başka örnek, bir robot kol tarafından alınacak detayların konumunun ve yönünün ölçülmesidir. Optik ayırma adı verilen bir işlem olan, istenmeyen gıda maddelerini dökme malzemeden çıkarmak için tarımsal süreçte yoğun bir şekilde makine görüsü kullanılmaktadır.
Askerî
Askerî uygulamalar muhtemelen bilgisayarlı görünün en geniş alanlarından biridir. En belirgin örnekler, düşman askerlerinin veya araçlarının tespiti ve füze rehberliğidir. Füze güdümüne yönelik daha gelişmiş sistemler, füzeyi belirli bir hedef yerine bir bölgeye göndermekte ve yerel olarak elde edilen görüntü verilerine göre füze alana ulaştığında hedef seçimi yapılmaktadır. "Savaş alanı farkındalığı" gibi modern askeri kavramlar, görüntü sensörleri de dahil olmak üzere çeşitli sensörlerin, stratejik kararları desteklemek için kullanılabilecek bir savaş sahnesi hakkında zengin bir bilgi kümesi sağladığını ifade etmektedir. Bu durumda, verilerin otomatik olarak işlenmesi, karmaşıklığı azaltmak ve güvenilirliği artırmak için birden çok sensörden gelen bilgileri birleştirmek için kullanılır.
Otonom araçlar
Yeni uygulama alanlarından biri, su altı araçları, kara tabanlı araçları (tekerlekli, arabalı veya kamyonlu küçük robotlar), hava araçları ve insansız hava araçlarını (İHA) içeren otonom araçlardır. Özgürlük seviyesi, tamamen otonom (insansız) araçlardan, bilgisayar destekli sistemlerin çeşitli durumlarda bir sürücüyü veya pilotu desteklediği araçlara kadar uzanmaktadır. Tamamen otonom araçlar genellikle navigasyon için bilgisayarlı görüyü kullanır, örneğin; nerede olduğunu bilmek veya çevresinin bir haritasını oluşturmak ve engelleri tespit etmek için kullanılmaktadır. Ayrıca, orman yangınlarını arayan bir İHA gibi belirli göreve özgü olayları tespit etmek için de kullanılabilmektedir. Destekleyici sistemlere örnek olarak, arabalardaki engel uyarı sistemleri ve uçakların otonom inişi için sistemler verilebilmektedir. Birkaç otomobil üreticisi otomobillerin otonom sürüşü için sistemler gösterdiler, ancak bu teknoloji hala piyasaya sürülebilecek bir seviyeye ulaşılamamıştır. Gelişmiş füzelerden keşif görevleri veya füze rehberliği için İHA'lara kadar geniş askeri otonom araç örnekleri vardır. NASA'nın Curiosity ve CNSA'nın (China National Space Administration, Çin Ulusal Uzay İdaresi) Yutu-2 gezgini gibi bilgisayarlı görü kullanan otonom araçlarla uzay araştırmaları yapılmaktadır.
Özgün görevleri
Uygulama alanlarının her biri bir dizi bilgisayarlı görü görevi kullanır; çeşitli yöntemler kullanılarak çözülebilen az çok iyi tanımlanmış ölçüm problemleri veya işleme problemleri. Özgün bilgisayarlı görü görevlerinin bazı örnekleri aşağıda sunulmuştur.
Bilgisayarlı görü görevleri, sayısal veya sembolik bilgiler, örneğin karar formlarında üretmek için dijital görüntüleri elde etme, işleme, analiz etme ve anlama ve gerçek dünyadan yüksek boyutlu verilerin çıkarılmasına yönelik yöntemleri içermektedir. Bu bağlamda anlamak, görsel imgelerin (retinanın girdisi) diğer düşünce süreçleriyle ara yüz oluşturabilen ve uygun eylemi ortaya çıkarabilen dünyanın tanımlarına dönüştürülmesi anlamına gelmektedir. Bu görüntü anlayışı, geometri, fizik, istatistik ve öğrenme teorisi yardımıyla oluşturulan modeller kullanılarak görüntü verilerinden sembolik bilgilerin çözülmesi olarak görülebilmektedir.
Tanıma
Bilgisayarlı görü, görüntü işleme ve makine görüsündeki başlıca sorunlardan biri görüntü verilerinin belirli bir nesne, özellik veya etkinlik içerip içermediğini belirlemektir. Literatürde tanıma sorunu farklı şekillerde ele alınmıştır.
- Nesne tanıma (nesne sınıflandırması da denir): Önceden belirlenmiş veya öğrenilmiş bir veya birkaç nesne veya nesne sınıfı, genellikle görüntüdeki 2D konumlarıyla veya sahnedeki 3D pozisyonlarıyla birlikte tanınabilmektedir. Blippar, Google Goggles ve LikeThat, bu işlevi gösteren bağımsız programlar sağlamaktadır.
- Kimlik: Bir nesnenin tek bir örneği tanınır. Örnekler arasında belirli bir kişinin yüzünün veya parmak izinin tanımlanması, el yazısı rakamların tanımlanması veya belirli bir aracın tanımlanması yer almaktadır.
- Tespit etme: Görüntü verileri belirli bir koşul için taranır. Örnekler arasında, tıbbi görüntülerde olası anormal hücrelerin veya dokuların tespiti veya bir aracın otomatik yol geçiş ücreti sisteminde tespit edilmesi yer almaktadır. Nispeten basit ve hızlı hesaplamalara dayanan tespit etme, bazen doğru bir yorumlama üretmek için daha hesaplama gerektiren tekniklerle daha fazla analiz edilebilen ilginç görüntü verilerinin daha küçük bölgelerini bulmak için kullanılmaktadır.
Şu anda, bu tür görevler için en iyi algoritmalar evrişimli sinir ağlarına dayanmaktadır. Yeteneklerinin bir örneği, ImageNet Büyük Ölçekli Görsel Tanıma Yarışması'nda verilmiştir; Bu, yarışmada kullanılan milyonlarca görüntü ve 1000 nesne sınıfıyla nesne sınıflandırma ve tespitinde bir kriterdir. ImageNet testlerinde evrişimli sinir ağlarının performansı artık insanlarınkine yakındır. En iyi algoritmalar, bir çiçeğin gövdesindeki küçük bir karınca veya elinde bir tüyü tutan bir kişi gibi küçük veya ince nesnelerle hala uğraşmaktadır. Ayrıca, filtrelerle bozulmuş görüntülerle de sorun yaşamaktadır. Bilgisayarların aksine, bu tür görüntüler insanları nadiren rahatsız etmektedir. Bununla birlikte, insanlar başka konularda sorun yaşama eğilimindedir. Örneğin, nesneleri belirli bir köpek türü veya kuş türleri gibi ince taneli sınıflara ayırmada iyi değillerdir, oysa evrişimli sinir ağları bunu kolaylıkla halletmektedir.
Aşağıdakiler gibi, tanımaya dayalı birkaç özel görev mevcuttur:
- İçeriğe dayalı görüntü alma: Belirli bir içeriğe sahip daha büyük bir görüntü kümesindeki tüm görüntüleri bulmaktadır. İçerik, örneğin bir hedef görüntüye göre benzerlik açısından veya metin girişi olarak verilen üst düzey arama kriterleri gibi farklı şekillerde belirtilebilmektedir.
- Poz tahmini: Kameraya göre belirli bir nesnenin konumunu veya yönünü tahmin edebilmektedir.
- Optik karakter tanıma: Genellikle metni düzenleme veya indekslemeye daha uygun bir formatta (örneğin ASCII) kodlamak amacıyla basılı veya el yazısı metnin görüntülerindeki karakterlerin tanımlanmasıdır.
- 2D kod okuma: Veri matrisi ve QR kodları gibi 2D kodların okumaktadır.
- Yüz tanıma
- Şekil Tanıma Teknolojisi: İnsanları nesnelerden ayıran teknolojidir.
Hareket analizi
Çeşitli görevleri vardır. Bir görüntü dizisinin, görüntüdeki veya 3D sahnedeki her noktada veya hatta görüntüleri üreten kameranın hızının bir tahminini üretmek için işlendiği hareket tahminiyle ilgilidir. Bu tür görevlerin örnekleri şunlardır:
- Egomotion: Kamera tarafından üretilen bir görüntü dizisinden kameranın 3D katı hareketini (döndürme ve öteleme) belirlemedir.
- Takip: Görüntü dizisindeki (genellikle) daha küçük bir dizi ilgi noktası veya nesnenin (örneğin araçlar, nesneler, insanlar veya diğer organizmalar) hareketlerini takip etmektir. Bu, yüksek çalışan makinelerin çoğu bu şekilde izlenebildiği için geniş endüstri uygulamalarına sahiptir.
- Optik akış: Görüntüdeki her nokta için o noktanın görüntü düzlemine göre nasıl hareket ettiğini belirlemek için kullanılmaktadır. Bu hareket, hem ilgili 3D noktasının sahnede nasıl hareket ettiğinin hem de kameranın sahneye göre nasıl hareket ettiğinin bir sonucudur.
Sahne yapılandırılması
Bir sahnenin veya videonun bir veya (özgün olarak) daha fazla görüntüsü verildiğinde, sahne yeniden yapılandırması sahnenin 3D modelini hesaplamayı amaçlamaktadır. En basit durumda, model bir dizi 3D nokta olabilmektedir. Daha karmaşık yöntemler, eksiksiz bir 3D yüzey modeli üretebilmektedir. Hareket veya tarama gerektirmeyen 3D görüntülemenin ve ilgili işleme algoritmalarının ortaya çıkışı, bu alanda hızlı ilerlemeler sağlamaktadır. Izgara tabanlı 3D algılama, birden çok açıdan 3D görüntüler elde etmek için kullanılabilmektedir. Algoritmalar artık birden fazla 3D görüntüyü nokta bulutları ve 3D modeller halinde birleştirmek için kullanılabilmektedir.
Görüntü onarımı
Görüntü onarımının amacı, görüntülerden gürültünün (sensör gürültüsü, hareket bulanıklığı vb.) giderilmesidir. Gürültünün giderilmesi için mümkün olan en basit yaklaşım, düşük geçişli filtreler veya medyan filtreler gibi çeşitli filtre türleridir. Daha karmaşık yöntemler, onları gürültüden ayırmak için yerel görüntü yapılarının nasıl göründüğüne dair bir model varsaymaktadır. Önce görüntü verilerinin çizgiler veya kenarlar gibi yerel görüntü yapıları açısından analiz edilmesi ve ardından analiz aşamasından gelen yerel bilgilere dayalı olarak filtrelemenin kontrol edilmesiyle, daha basit yaklaşımlara kıyasla genellikle daha iyi bir gürültü giderme seviyesi elde edilmektedir.
Bu alandaki bir örnek de boyamadır (Fotoğraflarda veya videolarda renk değişimi yapılması).
Sistem yöntemleri
Bir bilgisayarlı görü sisteminin organizasyonu büyük ölçüde uygulamaya bağlıdır. Bazı sistemler, belirli bir ölçüm veya algılama problemini çözen bağımsız uygulamalardır. Bir bilgisayarla görme sisteminin özel uygulaması aynı zamanda işlevselliğinin önceden belirlenmiş olmasına veya çalışma sırasında bir kısmının öğrenilip değiştirilemeyeceğine de bağlıdır. Birçok işlev uygulamaya özgüdür. Bununla birlikte, birçok bilgisayarlı görü sisteminde bulunan tipik işlevler vardır.
- Görüntü edinme: Bir dijital görüntü, çeşitli ışığa duyarlı kameraların yanı sıra mesafe sensörleri, tomografi cihazları, radar, ultrasonik kameralar ve benzeri araçları içeren bir veya birkaç görüntü sensörü tarafından üretilmektedir. Sensör tipine bağlı olarak, ortaya çıkan görüntü verileri sıradan bir 2D görüntü, 3D hacim veya bir görüntü dizisidir. Piksel değerleri tipik olarak bir veya birkaç spektral banttaki (gri görüntüler veya renkli görüntüler) ışık yoğunluğuna karşılık gelir, ancak derinlik, sonik veya elektromanyetik dalgaların soğurulması veya yansıması veya nükleer manyetik rezonans gibi çeşitli fiziksel ölçülerle de ilgili olabilmektedir.
- Ön işleme: Belirli bir bilgi parçasını çıkarmak için görüntü verilerine bir bilgisayarlı görü yöntemi uygulanmadan önce, yöntemin belirlediği belirli varsayımları karşıladığından emin olmak için genellikle verileri işlemek gerekmektedir. Örnekler:
- Görüntü koordinat sisteminin doğru olduğundan emin olmak için yeniden örnekleme.
- Sensör gürültüsünün yanlış bilgi vermemesini sağlamak için gürültü azaltma.
- İlgili bilgilerin tespit edilebilmesini sağlamak için karşıtlık geliştirme.
- Görüntü yapılarını yerel olarak uygun ölçeklerde geliştirmek için alan gösterimini ölçeklendirme.
- Özellik çıkarma: Çeşitli karmaşıklık düzeylerindeki görüntü özellikleri, görüntü verilerinden çıkarılır. Bu tür özelliklerin özgün örnekleri şunlardır:
- Çizgiler, kenarlar ve sırtlar.
- Köşeler, lekeler veya noktalar gibi yerelleştirilmiş ilgi noktaları.
Daha karmaşık özellikler doku, şekil veya hareketle ilgili olabilmektedir.
- Algılama / bölümleme (segmentation): İşlemenin bir noktasında, görüntünün hangi görüntü noktalarının veya bölgelerinin daha sonraki işlemlerle ilgili olduğuna dair bir karar verilmektedir. Örnekler:
- Belirli bir ilgi noktası kümesinin seçilmesi.
- Belirli bir ilgi nesnesini içeren bir veya birden çok görüntü bölgesinin bölümlenmesi.
- Görüntünün ön plan, nesne grupları, tek nesneler veya göze çarpan nesne parçalarını içeren iç içe geçmiş sahne mimarisine bölünmesi, görsel belirginlik ise genellikle uzamsal ve zamansal dikkat olarak uygulanması.
- Üst düzey işleme: Bu adımda, girdi tipik olarak küçük bir veri kümesidir, örneğin belirli bir nesneyi içerdiği varsayılan bir dizi nokta veya bir görüntü bölgesidir. Örneğin aşağıdakilerle ilgilenir:
- Verilerin model tabanlı ve uygulamaya özgü varsayımları karşıladığının doğrulanması.
- Nesne duruşu veya nesne boyutu gibi uygulamaya özel parametrelerin tahmini.
- Görüntü tanıma - tespit edilen bir nesneyi farklı kategorilere ayırmak.
- Görüntü kaydı - aynı nesnenin iki farklı görünümünü karşılaştırmak ve birleştirmek.
- Karar verme: Başvuru için gerekli olan nihai kararın verilmesidir. Örneğin:
- Otomatik denetim uygulamalarında başarılı / başarısız.
- Tanıma uygulamalarında eşleşme / eşleşme yok.
Görüntü anlama sistemleri
Görüntü anlama sistemleri (Image-understanding systems: IUS) aşağıdaki gibi üç soyutlama düzeyi içermektedir: düşük düzey; kenarlar, doku öğeleri veya bölgeler gibi görüntü temel öğelerini içermektedir; orta seviye; sınırları, yüzeyleri ve hacimleri içermektedir. Yüksek seviye; nesneleri, sahneleri veya olayları içermektedir. Bu gereksinimlerin çoğu, tamamen daha fazla araştırma yapılması gereken konulardır.
Bu seviyeler için IUS tasarımındaki temsil gereksinimleri şunlardır: Prototipik kavramların temsili, konsept organizasyonu, mekansal bilgi, zamansal bilgi, ölçekleme ve karşılaştırma ve farklılaştırma yoluyla açıklamadır. Çıkarım, şu anda bilinen gerçeklerden açıkça temsil edilmeyen yeni gerçekleri türetme sürecini ifade ederken; kontrol, işlemenin belirli bir aşamasında birçok çıkarım, arama ve eşleştirme tekniklerinden hangisinin uygulanması gerektiğini seçen süreci ifade etmektedir. IUS için çıkarım ve kontrol gereksinimleri şunlardır: Arama ve hipotez aktivasyonu, eşleştirme ve hipotez testi, beklentilerin oluşturulması ve kullanılması, dikkatin değişmesi ve odağı, inancın kesinliği ve gücü, çıkarım ve hedef tatminidir.
Kullanılan araçlar
Bilgisayarlı görü, birçok endüstri ve sektörde çok ihtiyaç duyulan devrimi getirdi. Bulut üzerinden hizmet olarak GPU, Makine Öğrenimi cihazları ve ML platformu gibi donanımlardaki gelişmeler, günümüzde bilgisayarla görmeyi daha etkileyici hale getirdi. Bu yazılım donanımlarından en çok kullanılan 6 tanesi ise:
- OpenCV: Bu iyi bilinen kitaplıktır. Görüntü ve video işleme görevlerini yürütmek için temel stratejileri ve algoritmaları kapsayan çok platformlu bir yöntemdir. OpenCV işlevleri ve Python dilleri ile çalışmaktadır.
- Tensorflow: Google tarafından geliştirilmiştir. TensorFlow 2.0, resimler, konuşma tanıma, nesne algılama, güçlendirilmiş öğrenme ve öneriler için önceden ayarlanmış ve hazırlanmış modellerin yürütülmesini sağlamaktadır.
- Matlab: Görüntü işleme uygulamaları yapmak için en iyi araçlardan bir tanesidir. Hızlı örneklemeye izin verdiği için araştırmalarda kullanılmaktadır. C++ dili ile karşılaştırıldığında çok sadedir ve sorun gidermeyi kolaylaştırmaktadır.
- CUDA: NVIDIA'nın bu aracı, paralel hesaplamanın temeli olarak kullanılmaktadır. CUDA, inanılmaz performans sunmak için GPU'ların gücünü kullanmaktadır. Araç kutusu, bir dizi görüntü, sinyal ve video işleme işlevini içeren NVIDIA Performance Primitives kitaplığını içermektedir.
- Theano: Bu Python tabanlı sayısal kitaplıktır. CPU veya GPU üzerinde çalışabilmektedir. Kanada'daki Montreal Üniversitesi'ndeki LISA grubu tarafından oluşturulmuştur. Araç, matematiksel ifadeleri kontrol etmek ve değerlendirmek için geliştirici bir derleyici olarak kullanılmaktadır.
- Keras: Farklı kitaplıkların en iyisini araçlarını birleştiren başka bir Python tabanlı derin öğrenme kitaplığıdır. TensorFlow, Theano ve CNTK'nın gücünü birleştirerek popülerlik kazanmıştır. TensorFlow, Microsoft Cognitive Toolkit, PlaidML veya Theano üzerinde çalışabilmektedir. Keras genellikle derin sinir ağları ile hızlı sonuçlar çıkarmak için kullanılmaktadır
Donanım
Pek çok tür bilgisayarlı görü sistemi vardır; ancak hepsi şu temel öğeleri içermektedir: bir güç kaynağı, en az bir görüntü edinme cihazı (kamera, ccd, vb.), bir işlemci ve kontrol ve iletişim kabloları veya bir tür kablosuz ara bağlantı mekanizması. Ek olarak, pratik bir görsel denetim sistemi ve sistemi izlemek için yazılımın yanı sıra bir ekran içermektedir. İç mekanlar için görüntü sistemleri, çoğu endüstriyel sistemde olduğu gibi, bir aydınlatma sistemi içerir ve kontrollü bir ortama yerleştirilebilmektedir. Ayrıca, tamamlanmış bir sistem, kamera destekleri, kablolar ve konektörler gibi birçok aksesuarı içermektedir.
Çoğu bilgisayarlı görü sistemi, bir sahneyi saniyede en fazla 60 kare (genellikle çok daha yavaş) kare hızlarında pasif olarak görüntüleyen görünür ışık kameraları kullanılmaktadır. Birkaç bilgisayarlı görü sistemi, yapılandırılmış ışıklı 3D tarayıcılar, termografik kameralar, hiperspektral görüntüleyiciler, radar görüntüleme, lidar tarayıcılar, manyetik rezonans görüntüleri, yandan taramalı sonar gibi aktif aydınlatmalı veya görünür ışıktan başka bir şey veya her ikisine sahip görüntü toplama donanımını kullanmaktadır. Bu tür donanım, görünür ışıklı görüntüleri işlemek için kullanılan aynı bilgisayar görme algoritmaları kullanılarak daha sonra sıklıkla işlenen "görüntüleri" yakalamaktadır. Geleneksel yayın ve tüketici video sistemleri saniyede 30 kare hızında çalışırken, dijital sinyal işleme ve tüketici grafik donanımındaki gelişmeler, saniyede binlerce kare ile yüzlerce gerçek zamanlı sistemler için yüksek hızlı görüntü alma, işleme ve görüntülemeyi mümkün kılmıştır. Robotikteki uygulamalar için hızlı, gerçek zamanlı video sistemleri kritik öneme sahiptir ve genellikle belirli algoritmalar için gerekli olan işlemeyi basitleştirebilmiştir. Yüksek hızlı bir projektörle birleştirildiğinde, hızlı görüntü elde etme, 3D ölçümün ve özellik izlemenin gerçekleştirilmesine olanak tanımaktadır.
2016 itibarıyla, görüntü işleme birimleri, bu roldeki CPU'ları ve grafik işleme birimlerini (GPU) tamamlamak için yeni bir işlemci sınıfı olarak ortaya çıkarmaktadır.
Geleceği
Teknolojinin daha fazla araştırılması ve iyileştirilmesiyle, bilgisayarlı görünün geleceği için daha geniş bir işlev yelpazesi gerçekleştirdiğini gösterecektir. Yalnızca bilgisayarlı görü teknolojilerinin eğitilmesi daha kolay olmayacak, aynı zamanda görüntülerden şu anda olduğundan daha fazlasını ayırt edebilecektir. Bilgisayarlı görü, daha güçlü uygulamalar oluşturmak için diğer teknolojilerle veya diğer yapay zeka alt kümeleriyle birlikte kullanılabileceği anlamına gelmektedir. Örneğin, resim yazısı oluşturma uygulamaları, çevredeki nesneleri görme engelli kişiler için yorumlamak için doğal dil işleme ile birleştirilebilecektir. Aynı zamanda yapay genel zeka ve yapay süper zekanın geliştirilmesinde, onlara bilgiyi insan görsel sistemi kadar hatta daha iyi işleme yeteneği vererek hayati bir rol oynayacaktır. Günümüzün teknoloji yetenekleri düşünüldüğünde, keşfedilmemiş kalan teknolojinin daha fazla faydası ve uygulaması olduğuna inanmak zor olabilmektedir. Bilgisayarlı görünün geleceği, bizim kadar insan olan yapay zeka sistemlerinin önünü açacaktır. Bununla birlikte, üstesinden gelinmesi gereken birkaç zorluk var, bunların en büyüğü yapay zekanın kara kutusunun gizemini çözmektir. Bunun nedeni, tıpkı diğer derin öğrenme uygulamaları gibi, işlevsel olarak etkili olmasına rağmen, iç işleyişi söz konusu olduğunda bu teknolojinin çözülemez olmasıdır.
Ayrıca bakınız
Kaynakça
- ^ a b Ballard, Dana H. (1982). Computer vision. Christopher M. Brown. Englewood Cliffs, N.J.: Prentice-Hall. ISBN . OCLC 7978044. 5 Haziran 2020 tarihinde kaynağından . Erişim tarihi: 23 Mayıs 2021.
- ^ a b Proceedings : 1996 CERN School of Computing : Egmond aan Zee, the Netherlands, 8 September-21 September 1996. C. E. Vandoni. Cenevre: CERN. 1996. ISBN . OCLC 36583267. 19 Eylül 2019 tarihinde kaynağından . Erişim tarihi: 23 Mayıs 2021.
- ^ a b Sonka, Milan (2008). Image processing, analysis, and machine vision. 3rd ed. Vaclav Hlavac, Roger Boyle. Toronto: Thompson Learning. ISBN . OCLC 123776599. 19 Eylül 2019 tarihinde kaynağından . Erişim tarihi: 23 Mayıs 2021.
- ^ a b Klette, Reinhard (2014). Concise computer vision : an introduction into theory and algorithms. Londra. ISBN . OCLC 869222487. 19 Eylül 2019 tarihinde kaynağından . Erişim tarihi: 23 Mayıs 2021.
- ^ a b Shapiro, Linda G. (2001). Computer vision. George C. Stockman. Upper Saddle River, NJ: Prentice Hall. ISBN . OCLC 45393572. 19 Eylül 2019 tarihinde kaynağından . Erişim tarihi: 23 Mayıs 2021.
- ^ Morris, Tim (2004). Computer vision and image processing. Basingstoke: Palgrave Macmillan. ISBN . OCLC 52486158. 19 Eylül 2019 tarihinde kaynağından . Erişim tarihi: 23 Mayıs 2021.
- ^ a b Forsyth, David (2003). Computer vision : a modern approach. Jean Ponce. Upper Saddle River, N.J.: Prentice Hall. ISBN . OCLC 50100728. 19 Eylül 2019 tarihinde kaynağından . Erişim tarihi: 23 Mayıs 2021.
- ^ . web.archive.org. 16 Şubat 2017. 16 Şubat 2017 tarihinde kaynağından arşivlendi. Erişim tarihi: 22 Mayıs 2021.
- ^ "X Prize seeks Star Trek-style tricorder". Physics Today. 2012. doi:10.1063/pt.5.025816. ISSN 1945-0699.
- ^ a b c d Szeliski, Richard (2011). Computer vision : algorithms and applications. Londra: Springer. ISBN . OCLC 682910466. 19 Eylül 2019 tarihinde kaynağından . Erişim tarihi: 23 Mayıs 2021.
- ^ Boden, Margaret A. (2008). Mind as machine : a history of cognitive science. [1st paperback ed.] Oxford: Clarendon Press. ISBN . OCLC 370242127. 19 Eylül 2019 tarihinde kaynağından . Erişim tarihi: 23 Mayıs 2021.
- ^ Kanade, Takeo (1987). Three-Dimensional Machine Vision. Boston, MA: Springer US. ISBN . OCLC 852791356.
- ^ Machine learning in computer vision. Nicu Sebe. Dordrecht: Springer. 2005. ISBN . OCLC 262677676.
- ^ a b c International Journal of Computer Vision. Springer Science and Business Media LLC.
- ^ Steger, Carsten (2018). Machine vision algorithms and applications. 2nd, completely revised and enlarged Edition. Markus Ulrich, Christian Wiedemann, Wiley-VCH. Weinheim, Germany. ISBN . OCLC 1006724129.
- ^ Murray, D.; Jennings, C. "Stereo vision based mapping and navigation for mobile robots". Proceedings of International Conference on Robotics and Automation. IEEE. doi:10.1109/robot.1997.614387. ISBN .
- ^ Soltani, Amir Arsalan; Huang, Haibin; Wu, Jiajun; Kulkarni, Tejas D.; Tenenbaum, Joshua B. (10 Temmuz 2017). "Synthesizing 3D Shapes via Modeling Multi-view Depth Maps and Silhouettes with Deep Generative Networks". 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE. doi:10.1109/cvpr.2017.269. ISBN .
- ^ "Advances in computer vision help robots see". Physics Today. 2011. doi:10.1063/pt.5.025462. ISSN 1945-0699.
- ^ Yoo, J.; Borselen, R.V.; Mubarak, M.S.; Tsingas, C. (2019). "Automated First Break Picking Method Using a Random Sample Consensus (RANSAC)". 81st EAGE Conference and Exhibition 2019. European Association of Geoscientists & Engineers. doi:10.3997/2214-4609.201901195.
- ^ Chervyakov, N.I.; Lyakhov, P.A.; Deryabin, M.A.; Nagornov, N.N.; Valueva, M.V.; Valuev, G.V. (10 Eylül 2020). "Residue Number System-Based Solution for Reducing the Hardware Cost of a Convolutional Neural Network". Neurocomputing. 407: 439-453. doi:10.1016/j.neucom.2020.04.018. ISSN 0925-2312.
- ^ Kaynak hatası: Geçersiz
<ref>
etiketi;3DVAE
isimli refler için metin sağlanmadı (Bkz: ) - ^ Zhou, Huan-Xiang (5 Kasım 2008). "The debut of PMC Biophysics". PMC Biophysics. 1 (1). doi:10.1186/1757-5036-1-1. ISSN 1757-5036. 6 Haziran 2020 tarihinde kaynağından . Erişim tarihi: 23 Mayıs 2021.
- ^ a b c Davies, E. R. (2005). Machine vision : theory, algorithms, practicalities. 3rd ed. Amsterdam: Elsevier. ISBN . OCLC 162571652.
- ^ Auteur., Forsyth, David A.,. Computer vision : a modern approach. ISBN . OCLC 1156470337.
- ^ "Erratum". Methods in Ecology and Evolution. 9 (9): 2041-2041. 26 Temmuz 2018. doi:10.1111/2041-210x.13066. ISSN 2041-210X.
- ^ Soltani, Amir Arsalan; Huang, Haibin; Wu, Jiajun; Kulkarni, Tejas D.; Tenenbaum, Joshua B. (1 Temmuz 2017). "Synthesizing 3D Shapes via Modeling Multi-view Depth Maps and Silhouettes with Deep Generative Networks". 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, HI: IEEE: 2511-2519. doi:10.1109/CVPR.2017.269. ISBN . 23 Mayıs 2021 tarihinde kaynağından . Erişim tarihi: 23 Mayıs 2021.
- ^ Maity, Abhishek (8 Şubat 2016). "Improvised Salient Object Detection and Manipulation". International Journal of Image, Graphics and Signal Processing. 8 (2): 53-60. doi:10.5815/ijigsp.2016.02.07. ISSN 2074-9074.
- ^ Encyclopedia of artificial intelligence. 2nd ed. Stuart Charles Shapiro. New York: Wiley. 1992. ISBN . OCLC 24589928.
- ^ Jun 2020, TechnologyTechGig Correspondent | 22; Views: 1876, 01:41 PM |. . TechGig. 24 Mayıs 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 24 Mayıs 2021.
- ^ Kagami, Shingo (1 Haziran 2010). "High-speed vision systems and projectors for real-time perception of the world". 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition - Workshops. IEEE. doi:10.1109/cvprw.2010.5543776. ISBN .
- ^ Ionica, Mircea Horea; Gregg, David (1 Ocak 2015). "The Movidius Myriad Architecture's Potential for Scientific Computing". IEEE Micro. 35 (1): 6-14. doi:10.1109/mm.2015.4. ISSN 0272-1732.
- ^ a b Joshi, Naveen. . Forbes (İngilizce). 27 Haziran 2019 tarihinde kaynağından arşivlendi. Erişim tarihi: 24 Mayıs 2021.
wikipedia, wiki, viki, vikipedia, oku, kitap, kütüphane, kütübhane, ara, ara bul, bul, herşey, ne arasanız burada,hikayeler, makale, kitaplar, öğren, wiki, bilgi, tarih, yukle, izle, telefon için, turk, türk, türkçe, turkce, nasıl yapılır, ne demek, nasıl, yapmak, yapılır, indir, ücretsiz, ücretsiz indir, bedava, bedava indir, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, resim, müzik, şarkı, film, film, oyun, oyunlar, mobil, cep telefonu, telefon, android, ios, apple, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, computer, bilgisayar
Bilgisayarli goru bilgisayarlarin dijital goruntulerden veya videolardan nasil bir anlam kazanabilecegiyle ilgilenen disiplinler arasi bilimsel bir alandir Muhendislik yontemleriyle insan gorsel sisteminin yapabilecegi gorevleri anlamaya ve otomatiklestirmeye calismaktadir Bir file binen bir adamin fotografini analiz eden DenseCap yogun resim yazisi yaziliminin ciktisi Bilgisayarli goru gorevleri sayisal veya sembolik bilgi uretmek icin dijital goruntuleri elde etme isleme analiz etme ve anlamayi icermektedir Ayni zamanda gercek dunyadan yuksek boyutlu verilerin cikarilmasina yonelik yontemleri icermektedir Buna gore anlamak gorsel imgelerin retinanin girdisi dusunce sureclerin anlamlandiran ve uygun eylemi ortaya cikarabilen dunya tanimlarina donusumu anlamina gelmektedir Bilgisayarli gorunun bilimsel disiplini goruntulerden bilgi cikaran yapay sistemlerin arkasindaki teori ile ilgilidir Goruntu verileri video parcalari birden cok kameradan gelen goruntuler bir 3B tarayicidan cok boyutlu veriler veya tibbi tarama cihazindan gelen goruntuler gibi bircok bicimde olabilmektedir Bilgisayarli goru vizyonunun teknolojik disiplini teorilerini ve modellerini bilgisayarla gorme sistemlerinin yapimina uygulamayi amaclamaktadir Bilgisayarli gorunun alt alanlari nesne algilama olay algilama video izleme nesne tanima 3D poz tahmini ogrenme indeksleme hareket tahmini otomatik gorsel olusturma 3D sahne modelleme ve goruntu onarimi gibi alanlardir TanimBilgisayarli goru bilgisayarlarin dijital goruntulerden veya videolardan nasil bir anlam kazanabilecegiyle ilgilenen disiplinler arasi bilimsel bir alandir Muhendislik yontemleriyle insan gorsel sisteminin yapabilecegi gorevleri anlamaya ve otomatiklestirmeye calismaktadir Bilgisayarli goru tek bir goruntuden veya bir dizi goruntuden yararli bilgilerin otomatik olarak cikarilmasi analizi ve anlasilmasiyla ilgilidir Otomatik gorsel anlayisa ulasmak icin teorik ve algoritmadan turetilen bir temelin gelistirilmesini icermektedir Bilimsel bir disiplin olarak bilgisayarli goru goruntulerden bilgi cikaran yapay sistemlerin arkasindaki teori ile ilgilenir Goruntu verileri video parcalari birden cok kameradan gelen goruntuler veya bir tibbi tarayicidan gelen cok boyutlu veriler gibi bircok bicimde olabilmektedir Teknolojik bir disiplin olarak bilgisayarli goru teorilerini ve modellerini bilgisayarla gorme sistemlerinin insasi icin uygulamaya calismaktadir Tarihce1960 larin sonlarinda yapay zekaya onculuk eden universitelerden bilgisayarli goru ile ilgili calismalar baslatildi Robotlara akilli davranislar kazandirmak icin bir basamak olan insan gorsel sistemini taklit ettirmek amaclaniyordu 1966 da bunun bir bilgisayara bir kamera baglatilarak ve gorduklerini tarif etmesini saglatilarak bir ufak bir proje ile basarilabilecegine inaniliyordu Bilgisayarli goruyu o donemde yaygin olan dijital goruntu isleme alanindan ayiran sey tarama yapilan alani tam olarak anlamak amaciyla goruntulerden uc boyutlu yapi cikarma arzusuydu 1970 lerde yapilan arastirmalar goruntulerden kenarlarin cikarilmasi cizgilerin etiketlenmesi cok yuzlu olmayan ve cok yuzlu modelleme nesnelerin daha kucuk yapilarin ara baglantilari olarak gosterilmesi optik akis ve hareket tahmini gibi bugun var olan bilgisayarli goru algoritmalarinin bircogunun ilk temellerini olusturdu Daha sonraki on yil bilgisayar vizyonunun daha titiz matematiksel analizine ve nicel yonlerine dayanan calismalar goruldu Bunlar arasinda olcek alani kavrami golgeleme doku ve odak gibi cesitli ipuclarindan sekil cikarimi ve yilanlar olarak bilinen kontur Resimde nesneyi belirgin gosteren cevre cizgisi modelleri yer aldi Arastirmacilar ayrica bu matematiksel kavramlarin cogunun duzenlilestirme ve Markov rastgele alanlari ile ayni optimizasyon cercevesi icinde ele alinabilecegini fark etmislerdir 1990 larda onceki arastirma konularindan bazilari digerlerinden daha aktif hale geldi Projektif 3 D onarim arastirmalari kamera kalibrasyonunun daha iyi anlasilmasina yol acmistir Kamera kalibrasyonu icin optimizasyon yontemlerinin ortaya cikmasiyla birlikte fotogrametri alanindan demet ayarlama teorisinde bircok fikrin kesfedildigi fark edilmistir Bu birden cok goruntuden sahnelerin seyrek 3 boyutlu onarimi icin farkli yontemlere yol acmistir Yogun uc boyutlu uygunluk problemi ve daha fazla coklu goruntulu uc boyutlu tekniklerinde ilerleme kaydedildi Ayni zamanda goruntu ayirmayi cozmek icin grafik kesiminin varyasyonlari kullanildi Bu on yil icinde gorsellerdeki yuzleri tanimak icin istatistiksel ogrenme tekniklerinin ilk kez pratikte kullanilmistir Ornegin Eigenface 1990 larin sonlarina dogru bilgisayar grafikleri ve bilgisayar gorusu alanlari arasindaki etkilesimin artmasiyla onemli bir degisiklik meydana gelmistir Bu goruntu tabanli olusturma goruntu donusturme gorunum enterpolasyonu panoramik goruntu birlestirme ve erken isik alani olusturmayi iceriyordu Son zamanlarda yapilan calismalar makine ogrenimi teknikleri ve karmasik optimizasyon cerceveleri ile birlikte kullanilan ozellik tabanli yontemlerin yeniden canlandigini gordu Derin Ogrenme tekniklerinin ilerlemesi bilgisayarli goru alanina daha fazla yenilik getirdi Siniflandirma segmentasyon ve optik akis gibi cesitli gorevler icin cesitli karsilastirmali bilgisayarli goru veri setlerinde derin ogrenme algoritmalarinin dogrulugu onceki yontemleri geride birakmistir Ilgili alanlarFotografta Nesne tespitiKati hal fizigi Kati hal fizigi bilgisayarli goru ile yakindan ilgili olan baska bir alandir Cogu bilgisayarli goru sistemi tipik olarak gorunur veya kizilotesi isik seklinde olan elektromanyetik radyasyonu algilayan goruntu sensorleri ile calismaktadir Sensorler kuantum fizigi kullanilarak tasarlanmistir Isigin yuzeylerle etkilesime girdigi surec fizik kurallar kullanilarak aciklanmaktadir Fizik cogu goruntuleme sisteminin temel bir parcasi olan optigin davranisini aciklar Gelismis goruntu sensorleri goruntu olusum surecini tam olarak anlamak icin kuantum mekanigine bile ihtiyac duymaktadir Ayrica fizikteki cesitli olcum problemleri ornegin sivilarda hareket gibi bilgisayarli goru kullanilarak ele alinabilmektedir Sinir bilimi Onemli bir rol oynayan ikinci bir alan sinir bilimi ozellikle biyolojik goru sistemi calismasidir Gecen yuzyilda hem insanlarda hem de cesitli hayvanlarda gorsel uyaranlarin islenmesi icin calisan gozler noronlar ve beyin yapilari uzerinde kapsamli bir calisma yapilmistir Bu gorme ile ilgili belirli gorevleri cozmek icin gercek goruntu sistemlerinin nasil calistigina dair kaba ancak karmasik bir aciklamaya yol acmistir Bu sonuclar yapay sistemlerin biyolojik sistemlerden farkli karmasiklik duzeylerinde islenmesine yol acmistir Ayni zamanda davranislari taklit edecek sekilde tasarlandigi bilgisayarli goru icinde bir alt alana yol acmistir Ayrica bilgisayarli goru icinde gelistirilen ogrenmeye dayali yontemlerden bazilari ornegin sinir agi derin ogrenme tabanli goruntu ve ozellik analizi ve siniflandirma biyoloji gecmisine sahiptir Bilgisayarli goru arastirmalarinin bazi turleri biyolojik vizyon arastirmalariyla yakindan ilgilidir Aslinda yapay zeka arastirmalarinin bircok turunun insan bilincine yonelik arastirmalarla ve gorsel bilgileri yorumlamak entegre etmek ve kullanmak icin depolanan bilginin kullanimiyla yakindan baglantili olmasi gibi ornekler verilebilmektedir Biyolojik gorme alani insanlarda ve diger hayvanlarda gorsel alginin arkasindaki fizyolojik surecleri inceler ve modeller Bilgisayarli goru ise yapay gorme sistemlerinin arkasinda yazilim ve donanimda uygulanan surecleri inceler ve aciklar Biyolojik ve bilgisayarli goru arasindaki disiplinler arasi alisveris her iki alan icin de verimli olmaktadir Sinyal isleme Bilgisayarli goru ilgili bir baska alan da sinyal islemedir Tek degiskenli sinyallerin tipik olarak zamansal sinyallerin islenmesine yonelik bircok yontem bilgisayarli gorude iki degiskenli sinyallerin veya cok degiskenli sinyallerin islenmesine dogal bir sekilde genisletilebilmektedir Bununla birlikte goruntulerin ozel dogasi nedeniyle tek degiskenli sinyallerin islenmesinde karsiligi olmayan bilgisayarli goru icerisinde gelistirilen bircok yontem vardir Sinyalin cok boyutluluguyla birlikte sinyal islemede bilgisayar gorusunun bir parcasi olarak bir alt alani tanimlanmaktadir Robotik navigasyon Robot navigasyonu robotik sistemlerin bir ortamda gezinmesi icin otonom yol planlamasi veya dusuncesiyle ilgilenmektedir Iclerinde gezinmek icin bu ortamlarin ayrintili olarak anlasilmasi gerekmektedir Cevre hakkindaki bilgiler bir goruntu sensoru gorevi goren ve cevre ile robot hakkinda ust duzey bilgi saglayan bir bilgisayar goruntu sistemi tarafindan saglanabilir Diger alanlar Bilgisayarli goru ile ilgili yukarida bahsedilen goruslerin yani sira ilgili arastirma konularinin cogu tamamen matematiksel bir bakis acisiyla da incelenebilmektedir Ornegin bilgisayarli gorudeki bircok yontem istatistiklere optimizasyona veya geometriye dayanmaktadir Son olarak alanin onemli bir kismi bilgisayar vizyonunun uygulama yonune ayrilmistir cesitli yazilim ve donanim kombinasyonlarinda mevcut yontemlerin nasil gerceklestirilebilecegi veya cok fazla performans kaybetmeden islem hizi kazanmak icin bu yontemlerin nasil degistirilebilecegi gibi alanlarla da ilgilenmektedir Bilgisayarli goru ayrica moda e ticaretinde envanter yonetiminde patent arastirmasinda mobilyada ve guzellik endustrisinde de kullanilmaktadir Ayrimlar Bilgisayarli goru ile en yakindan ilgili alanlar goruntu isleme goruntu analizi ve makine gorusudur Bunlarin kapsadigi cesitli teknikler ve uygulamalar arasinda onemli bir benzerlik vardir Bunun anlami bu alanlarda kullanilan ve gelistirilen temel tekniklerin benzer oldugunu farkli isimlere sahip tek bir alan oldugu seklinde yorumlanabilecek oldugunu ima etmektedir Ote yandan arastirma gruplarinin bilimsel dergilerin konferanslarin ve sirketlerin kendilerini ozellikle bu alanlardan birine ait olarak sunmalari veya pazarlamalari gerekli gorunmektedir Bu nedenle her alani digerlerinden ayiran cesitli nitelendirmeler olmustur Bilgisayar grafikleri 3D modellerden goruntu verileri uretmektedir bilgisayarli goru genellikle goruntu verilerinden 3D modeller uretmektedir Ornegin artirilmis gerceklikte kesfedildigi gibi iki disiplinin bir kombinasyonuna dogru bir egilim vardir Asagidaki nitelendirmeler konuyla ilgili gorunmektedir ancak evrensel olarak kabul edildigi gibi alinmamalidir Goruntu isleme ve goruntu analizi genellikle 2D goruntulere bir goruntunun digerine nasil donusturulecegine ornegin kontrast gelistirme gibi piksel bazli islemler kenar cikarma veya gurultu giderme gibi yerel islemler veya goruntuyu dondurme gibi geometrik donusumlere odaklanma egilimindedir Bu tanimlandirma goruntu islemenin veya analizinin ne varsayimlar gerektirdigini ne de goruntu icerigi hakkinda yorumlar uretmedigini ima etmektedir Bilgisayarli goru 2D goruntulerden 3D goruntu analizini icermektedir Bu bir veya birkac goruntu uzerine yansitilan 3D sahneyi analiz eder ornegin 3D sahne hakkindaki yapinin veya diger bilgilerin bir veya birkac goruntuden nasil yeniden yapilandirilacagi ifade etmektedir Bilgisayarli goru genellikle bir goruntude tasvir edilen sahne hakkinda az cok karmasik varsayimlara dayanmaktadir Makine gorusu endustriyel uygulamalarda goruntuleme tabanli otomatik inceleme surec kontrolu ve robot rehberligi saglamak icin bir dizi teknolojiyi ve yontemi uygulama surecidir Makine gorusu temel olarak uretimde ornegin vizyon tabanli robotlar ve gorsel tabanli inceleme olcum veya toplama cop toplama gibi sistemleri gibi uygulamalara odaklanma egilimindedir Bu goruntu sensoru teknolojilerinin ve kontrol teorisinin genellikle bir robotu kontrol etmek icin goruntu verilerinin islenmesi ile butunlestirildigi sonucu cikarilmaktadir Ayrica gercek zamanli islemenin donanim ve yazilimdaki verimli uygulamalarla vurgulandigi anlamina gelmektedir Ayni zamanda aydinlatma gibi dis kosullarin makine gorusunde genel bilgisayarli gorude oldugundan daha fazla kontrol edilebilecegini ve genellikle daha kontrollu oldugunu ifade etmektedir Bu da farkli algoritmalarin kullanilmasini saglayabilecegini ima etmektedir Oncelikle goruntu uretme surecine odaklanan ancak bazen goruntulerin islenmesi ve analizi ile ilgilenen goruntuleme adi verilen bir alan da vardir Ornegin tibbi goruntuleme tibbi uygulamalardaki goruntu verilerinin analizine yonelik onemli calismalari icermektedir Son olarak oruntu tanima temel olarak istatistiksel yaklasimlara ve yapay sinir aglarina dayanan genel olarak sinyallerden bilgi cikarmak icin cesitli yontemler kullanan bir alandir Bu alanin onemli bir kismi bu yontemlerin goruntu verilerine uygulanmasina ayrilmistir Uygulama alanlariNesne tanimlama Uygulamalar uretim hattinda hizla ilerleyen siseleri inceleyen endustriyel makine gorme sistemleri gibi gorevlerden yapay zeka ve cevrelerindeki dunyayi kavrayabilen bilgisayarlar veya robotlar uzerine arastirmalara kadar uzanmaktadir Bilgisayarli goru ve makine gorusu alanlari onemli olcude ortusmektedir Bilgisayarli goru bircok alanda kullanilan otomatik goruntu analizinin temel teknolojisini kapsamaktadir Makine gorusu genellikle endustriyel uygulamalarda otomatik inceleme ve robot rehberligi saglamak icin otomatik goruntu analizini diger yontem ve teknolojilerle birlestirme surecini ifade etmektedir Pek cok bilgisayarli goru uygulamasinda bilgisayarlar belirli bir gorevi cozmek icin onceden programlanmistir ancak ogrenmeye dayali yontemler artik giderek yayginlasmaktadir Bilgisayarli goru uygulamalarinin ornekleri asagidakilere yonelik sistemleri icermektedir 3B sekilleri ogrenmek bilgisayarla gorme alaninda zor bir gorev olmustur Derin ogrenme alanindaki son gelismeler arastirmacilarin tek veya coklu gorunumden derinlik haritasi veya siluetlerden sorunsuz ve verimli bir sekilde 3B sekilleri yeniden olusturabilen ve uretebilen modeller olusturmasini saglamistir Otomatik inceleme ornegin imalat uygulamalarinda Insanlari tanimlama gorevlerinde yardimci olmak ornegin bir tur tanimlama sistemi Kontrol surecleri ornegin bir endustriyel robot Olaylari tespit etme ornegin gorsel izleme veya insan sayimi Etkilesim ornegin bilgisayar insan etkilesimi icin bir cihaza girdi olarak Nesneleri veya ortamlari modelleme ornegin tibbi goruntu analizi veya topografik modelleme Navigasyon ornegin otonom bir arac veya mobil robot yon bulma Bilgilerin duzenlenmesi ornegin goruntu veri tabanlarinin ve goruntu dizilerinin indekslenmesi Saglik En onemli uygulama alanlarindan biri bir hastayi teshis etmek icin goruntu verilerinden bilgilerin cikarilmasiyla bir sonuc elde eden tibbi bilgisayarli goru veya tibbi goruntu islemedir Bunun bir ornegi tumorlerin veya diger anormal degisikliklerin saptanmasidir organ boyutlari kan akisi vb olcumleri baska bir ornektir Ayni zamanda yeni bilgiler saglayarak tibbi arastirmalari desteklemektedir ornegin beynin yapisi veya tibbi tedavilerin kalitesi hakkinda Tibbi alandaki bilgisayarli goru uygulamalari ornegin gurultunun etkisini azaltmak icin insanlar tarafindan yorumlanan ultrasonik goruntuler veya X isini goruntuleri tarafindan yorumlanan goruntulerin gelistirilmesini de icermektedir Makine gorusu Bilgisayarli gorudeki ikinci bir uygulama alani makine gorusu olarak adlandirilan ve bir uretim surecini desteklemek amaciyla bilginin cikarildigi endustridir Bir ornek vermek gerekir ise kusurlari bulmak icin ayrintilarin veya nihai urunlerin otomatik olarak incelendigi kalite kontroludur Bir baska ornek bir robot kol tarafindan alinacak detaylarin konumunun ve yonunun olculmesidir Optik ayirma adi verilen bir islem olan istenmeyen gida maddelerini dokme malzemeden cikarmak icin tarimsal surecte yogun bir sekilde makine gorusu kullanilmaktadir Askeri Bilgisayarli goru kullanan bir insansiz hava araci Askeri uygulamalar muhtemelen bilgisayarli gorunun en genis alanlarindan biridir En belirgin ornekler dusman askerlerinin veya araclarinin tespiti ve fuze rehberligidir Fuze gudumune yonelik daha gelismis sistemler fuzeyi belirli bir hedef yerine bir bolgeye gondermekte ve yerel olarak elde edilen goruntu verilerine gore fuze alana ulastiginda hedef secimi yapilmaktadir Savas alani farkindaligi gibi modern askeri kavramlar goruntu sensorleri de dahil olmak uzere cesitli sensorlerin stratejik kararlari desteklemek icin kullanilabilecek bir savas sahnesi hakkinda zengin bir bilgi kumesi sagladigini ifade etmektedir Bu durumda verilerin otomatik olarak islenmesi karmasikligi azaltmak ve guvenilirligi artirmak icin birden cok sensorden gelen bilgileri birlestirmek icin kullanilir Otonom araclar Kara tabanli vidasiz bir arac ornegi olan Curiosity adli sanatcinin Curiosity konsepti Gezginin ustune monte edilmis stereo kameraya dikkat edin Yeni uygulama alanlarindan biri su alti araclari kara tabanli araclari tekerlekli arabali veya kamyonlu kucuk robotlar hava araclari ve insansiz hava araclarini IHA iceren otonom araclardir Ozgurluk seviyesi tamamen otonom insansiz araclardan bilgisayar destekli sistemlerin cesitli durumlarda bir surucuyu veya pilotu destekledigi araclara kadar uzanmaktadir Tamamen otonom araclar genellikle navigasyon icin bilgisayarli goruyu kullanir ornegin nerede oldugunu bilmek veya cevresinin bir haritasini olusturmak ve engelleri tespit etmek icin kullanilmaktadir Ayrica orman yanginlarini arayan bir IHA gibi belirli goreve ozgu olaylari tespit etmek icin de kullanilabilmektedir Destekleyici sistemlere ornek olarak arabalardaki engel uyari sistemleri ve ucaklarin otonom inisi icin sistemler verilebilmektedir Birkac otomobil ureticisi otomobillerin otonom surusu icin sistemler gosterdiler ancak bu teknoloji hala piyasaya surulebilecek bir seviyeye ulasilamamistir Gelismis fuzelerden kesif gorevleri veya fuze rehberligi icin IHA lara kadar genis askeri otonom arac ornekleri vardir NASA nin Curiosity ve CNSA nin China National Space Administration Cin Ulusal Uzay Idaresi Yutu 2 gezgini gibi bilgisayarli goru kullanan otonom araclarla uzay arastirmalari yapilmaktadir Ozgun gorevleriUygulama alanlarinin her biri bir dizi bilgisayarli goru gorevi kullanir cesitli yontemler kullanilarak cozulebilen az cok iyi tanimlanmis olcum problemleri veya isleme problemleri Ozgun bilgisayarli goru gorevlerinin bazi ornekleri asagida sunulmustur Bilgisayarli goru gorevleri sayisal veya sembolik bilgiler ornegin karar formlarinda uretmek icin dijital goruntuleri elde etme isleme analiz etme ve anlama ve gercek dunyadan yuksek boyutlu verilerin cikarilmasina yonelik yontemleri icermektedir Bu baglamda anlamak gorsel imgelerin retinanin girdisi diger dusunce surecleriyle ara yuz olusturabilen ve uygun eylemi ortaya cikarabilen dunyanin tanimlarina donusturulmesi anlamina gelmektedir Bu goruntu anlayisi geometri fizik istatistik ve ogrenme teorisi yardimiyla olusturulan modeller kullanilarak goruntu verilerinden sembolik bilgilerin cozulmesi olarak gorulebilmektedir Tanima Bilgisayarli goru goruntu isleme ve makine gorusundeki baslica sorunlardan biri goruntu verilerinin belirli bir nesne ozellik veya etkinlik icerip icermedigini belirlemektir Literaturde tanima sorunu farkli sekillerde ele alinmistir Nesne tanima nesne siniflandirmasi da denir Onceden belirlenmis veya ogrenilmis bir veya birkac nesne veya nesne sinifi genellikle goruntudeki 2D konumlariyla veya sahnedeki 3D pozisyonlariyla birlikte taninabilmektedir Blippar Google Goggles ve LikeThat bu islevi gosteren bagimsiz programlar saglamaktadir Kimlik Bir nesnenin tek bir ornegi taninir Ornekler arasinda belirli bir kisinin yuzunun veya parmak izinin tanimlanmasi el yazisi rakamlarin tanimlanmasi veya belirli bir aracin tanimlanmasi yer almaktadir Tespit etme Goruntu verileri belirli bir kosul icin taranir Ornekler arasinda tibbi goruntulerde olasi anormal hucrelerin veya dokularin tespiti veya bir aracin otomatik yol gecis ucreti sisteminde tespit edilmesi yer almaktadir Nispeten basit ve hizli hesaplamalara dayanan tespit etme bazen dogru bir yorumlama uretmek icin daha hesaplama gerektiren tekniklerle daha fazla analiz edilebilen ilginc goruntu verilerinin daha kucuk bolgelerini bulmak icin kullanilmaktadir Su anda bu tur gorevler icin en iyi algoritmalar evrisimli sinir aglarina dayanmaktadir Yeteneklerinin bir ornegi ImageNet Buyuk Olcekli Gorsel Tanima Yarismasi nda verilmistir Bu yarismada kullanilan milyonlarca goruntu ve 1000 nesne sinifiyla nesne siniflandirma ve tespitinde bir kriterdir ImageNet testlerinde evrisimli sinir aglarinin performansi artik insanlarinkine yakindir En iyi algoritmalar bir cicegin govdesindeki kucuk bir karinca veya elinde bir tuyu tutan bir kisi gibi kucuk veya ince nesnelerle hala ugrasmaktadir Ayrica filtrelerle bozulmus goruntulerle de sorun yasamaktadir Bilgisayarlarin aksine bu tur goruntuler insanlari nadiren rahatsiz etmektedir Bununla birlikte insanlar baska konularda sorun yasama egilimindedir Ornegin nesneleri belirli bir kopek turu veya kus turleri gibi ince taneli siniflara ayirmada iyi degillerdir oysa evrisimli sinir aglari bunu kolaylikla halletmektedir Asagidakiler gibi tanimaya dayali birkac ozel gorev mevcuttur Icerige dayali goruntu alma Belirli bir icerige sahip daha buyuk bir goruntu kumesindeki tum goruntuleri bulmaktadir Icerik ornegin bir hedef goruntuye gore benzerlik acisindan veya metin girisi olarak verilen ust duzey arama kriterleri gibi farkli sekillerde belirtilebilmektedir Halka acik yerlerde alisveris merkezlerinde alisveris merkezlerinde kisi sayma amacli bilgisayarla gormePoz tahmini Kameraya gore belirli bir nesnenin konumunu veya yonunu tahmin edebilmektedir Optik karakter tanima Genellikle metni duzenleme veya indekslemeye daha uygun bir formatta ornegin ASCII kodlamak amaciyla basili veya el yazisi metnin goruntulerindeki karakterlerin tanimlanmasidir 2D kod okuma Veri matrisi ve QR kodlari gibi 2D kodlarin okumaktadir Yuz tanima Sekil Tanima Teknolojisi Insanlari nesnelerden ayiran teknolojidir Hareket analizi Cesitli gorevleri vardir Bir goruntu dizisinin goruntudeki veya 3D sahnedeki her noktada veya hatta goruntuleri ureten kameranin hizinin bir tahminini uretmek icin islendigi hareket tahminiyle ilgilidir Bu tur gorevlerin ornekleri sunlardir Egomotion Kamera tarafindan uretilen bir goruntu dizisinden kameranin 3D kati hareketini dondurme ve oteleme belirlemedir Takip Goruntu dizisindeki genellikle daha kucuk bir dizi ilgi noktasi veya nesnenin ornegin araclar nesneler insanlar veya diger organizmalar hareketlerini takip etmektir Bu yuksek calisan makinelerin cogu bu sekilde izlenebildigi icin genis endustri uygulamalarina sahiptir Optik akis Goruntudeki her nokta icin o noktanin goruntu duzlemine gore nasil hareket ettigini belirlemek icin kullanilmaktadir Bu hareket hem ilgili 3D noktasinin sahnede nasil hareket ettiginin hem de kameranin sahneye gore nasil hareket ettiginin bir sonucudur Sahne yapilandirilmasi Bir sahnenin veya videonun bir veya ozgun olarak daha fazla goruntusu verildiginde sahne yeniden yapilandirmasi sahnenin 3D modelini hesaplamayi amaclamaktadir En basit durumda model bir dizi 3D nokta olabilmektedir Daha karmasik yontemler eksiksiz bir 3D yuzey modeli uretebilmektedir Hareket veya tarama gerektirmeyen 3D goruntulemenin ve ilgili isleme algoritmalarinin ortaya cikisi bu alanda hizli ilerlemeler saglamaktadir Izgara tabanli 3D algilama birden cok acidan 3D goruntuler elde etmek icin kullanilabilmektedir Algoritmalar artik birden fazla 3D goruntuyu nokta bulutlari ve 3D modeller halinde birlestirmek icin kullanilabilmektedir Goruntu onarimi Goruntu onariminin amaci goruntulerden gurultunun sensor gurultusu hareket bulanikligi vb giderilmesidir Gurultunun giderilmesi icin mumkun olan en basit yaklasim dusuk gecisli filtreler veya medyan filtreler gibi cesitli filtre turleridir Daha karmasik yontemler onlari gurultuden ayirmak icin yerel goruntu yapilarinin nasil gorundugune dair bir model varsaymaktadir Once goruntu verilerinin cizgiler veya kenarlar gibi yerel goruntu yapilari acisindan analiz edilmesi ve ardindan analiz asamasindan gelen yerel bilgilere dayali olarak filtrelemenin kontrol edilmesiyle daha basit yaklasimlara kiyasla genellikle daha iyi bir gurultu giderme seviyesi elde edilmektedir Bu alandaki bir ornek de boyamadir Fotograflarda veya videolarda renk degisimi yapilmasi Sistem yontemleriBir bilgisayarli goru sisteminin organizasyonu buyuk olcude uygulamaya baglidir Bazi sistemler belirli bir olcum veya algilama problemini cozen bagimsiz uygulamalardir Bir bilgisayarla gorme sisteminin ozel uygulamasi ayni zamanda islevselliginin onceden belirlenmis olmasina veya calisma sirasinda bir kisminin ogrenilip degistirilemeyecegine de baglidir Bircok islev uygulamaya ozgudur Bununla birlikte bircok bilgisayarli goru sisteminde bulunan tipik islevler vardir Goruntu edinme Bir dijital goruntu cesitli isiga duyarli kameralarin yani sira mesafe sensorleri tomografi cihazlari radar ultrasonik kameralar ve benzeri araclari iceren bir veya birkac goruntu sensoru tarafindan uretilmektedir Sensor tipine bagli olarak ortaya cikan goruntu verileri siradan bir 2D goruntu 3D hacim veya bir goruntu dizisidir Piksel degerleri tipik olarak bir veya birkac spektral banttaki gri goruntuler veya renkli goruntuler isik yogunluguna karsilik gelir ancak derinlik sonik veya elektromanyetik dalgalarin sogurulmasi veya yansimasi veya nukleer manyetik rezonans gibi cesitli fiziksel olculerle de ilgili olabilmektedir On isleme Belirli bir bilgi parcasini cikarmak icin goruntu verilerine bir bilgisayarli goru yontemi uygulanmadan once yontemin belirledigi belirli varsayimlari karsiladigindan emin olmak icin genellikle verileri islemek gerekmektedir Ornekler Goruntu koordinat sisteminin dogru oldugundan emin olmak icin yeniden ornekleme Sensor gurultusunun yanlis bilgi vermemesini saglamak icin gurultu azaltma Ilgili bilgilerin tespit edilebilmesini saglamak icin karsitlik gelistirme Goruntu yapilarini yerel olarak uygun olceklerde gelistirmek icin alan gosterimini olceklendirme Ozellik cikarma Cesitli karmasiklik duzeylerindeki goruntu ozellikleri goruntu verilerinden cikarilir Bu tur ozelliklerin ozgun ornekleri sunlardir Cizgiler kenarlar ve sirtlar Koseler lekeler veya noktalar gibi yerellestirilmis ilgi noktalari Daha karmasik ozellikler doku sekil veya hareketle ilgili olabilmektedir Algilama bolumleme segmentation Islemenin bir noktasinda goruntunun hangi goruntu noktalarinin veya bolgelerinin daha sonraki islemlerle ilgili olduguna dair bir karar verilmektedir Ornekler Belirli bir ilgi noktasi kumesinin secilmesi Belirli bir ilgi nesnesini iceren bir veya birden cok goruntu bolgesinin bolumlenmesi Goruntunun on plan nesne gruplari tek nesneler veya goze carpan nesne parcalarini iceren ic ice gecmis sahne mimarisine bolunmesi gorsel belirginlik ise genellikle uzamsal ve zamansal dikkat olarak uygulanmasi Ust duzey isleme Bu adimda girdi tipik olarak kucuk bir veri kumesidir ornegin belirli bir nesneyi icerdigi varsayilan bir dizi nokta veya bir goruntu bolgesidir Ornegin asagidakilerle ilgilenir Verilerin model tabanli ve uygulamaya ozgu varsayimlari karsiladiginin dogrulanmasi Nesne durusu veya nesne boyutu gibi uygulamaya ozel parametrelerin tahmini Goruntu tanima tespit edilen bir nesneyi farkli kategorilere ayirmak Goruntu kaydi ayni nesnenin iki farkli gorunumunu karsilastirmak ve birlestirmek Karar verme Basvuru icin gerekli olan nihai kararin verilmesidir Ornegin Otomatik denetim uygulamalarinda basarili basarisiz Tanima uygulamalarinda eslesme eslesme yok Goruntu anlama sistemleri Goruntu anlama sistemleri Image understanding systems IUS asagidaki gibi uc soyutlama duzeyi icermektedir dusuk duzey kenarlar doku ogeleri veya bolgeler gibi goruntu temel ogelerini icermektedir orta seviye sinirlari yuzeyleri ve hacimleri icermektedir Yuksek seviye nesneleri sahneleri veya olaylari icermektedir Bu gereksinimlerin cogu tamamen daha fazla arastirma yapilmasi gereken konulardir Bu seviyeler icin IUS tasarimindaki temsil gereksinimleri sunlardir Prototipik kavramlarin temsili konsept organizasyonu mekansal bilgi zamansal bilgi olcekleme ve karsilastirma ve farklilastirma yoluyla aciklamadir Cikarim su anda bilinen gerceklerden acikca temsil edilmeyen yeni gercekleri turetme surecini ifade ederken kontrol islemenin belirli bir asamasinda bircok cikarim arama ve eslestirme tekniklerinden hangisinin uygulanmasi gerektigini secen sureci ifade etmektedir IUS icin cikarim ve kontrol gereksinimleri sunlardir Arama ve hipotez aktivasyonu eslestirme ve hipotez testi beklentilerin olusturulmasi ve kullanilmasi dikkatin degismesi ve odagi inancin kesinligi ve gucu cikarim ve hedef tatminidir Kullanilan araclarBilgisayarli goru bircok endustri ve sektorde cok ihtiyac duyulan devrimi getirdi Bulut uzerinden hizmet olarak GPU Makine Ogrenimi cihazlari ve ML platformu gibi donanimlardaki gelismeler gunumuzde bilgisayarla gormeyi daha etkileyici hale getirdi Bu yazilim donanimlarindan en cok kullanilan 6 tanesi ise OpenCV Bu iyi bilinen kitapliktir Goruntu ve video isleme gorevlerini yurutmek icin temel stratejileri ve algoritmalari kapsayan cok platformlu bir yontemdir OpenCV islevleri C ve Python dilleri ile calismaktadir Tensorflow Google tarafindan gelistirilmistir TensorFlow 2 0 resimler konusma tanima nesne algilama guclendirilmis ogrenme ve oneriler icin onceden ayarlanmis ve hazirlanmis modellerin yurutulmesini saglamaktadir Matlab Goruntu isleme uygulamalari yapmak icin en iyi araclardan bir tanesidir Hizli orneklemeye izin verdigi icin arastirmalarda kullanilmaktadir C dili ile karsilastirildiginda cok sadedir ve sorun gidermeyi kolaylastirmaktadir CUDA NVIDIA nin bu araci paralel hesaplamanin temeli olarak kullanilmaktadir CUDA inanilmaz performans sunmak icin GPU larin gucunu kullanmaktadir Arac kutusu bir dizi goruntu sinyal ve video isleme islevini iceren NVIDIA Performance Primitives kitapligini icermektedir Theano Bu Python tabanli sayisal kitapliktir CPU veya GPU uzerinde calisabilmektedir Kanada daki Montreal Universitesi ndeki LISA grubu tarafindan olusturulmustur Arac matematiksel ifadeleri kontrol etmek ve degerlendirmek icin gelistirici bir derleyici olarak kullanilmaktadir Keras Farkli kitapliklarin en iyisini araclarini birlestiren baska bir Python tabanli derin ogrenme kitapligidir TensorFlow Theano ve CNTK nin gucunu birlestirerek populerlik kazanmistir TensorFlow Microsoft Cognitive Toolkit PlaidML veya Theano uzerinde calisabilmektedir Keras genellikle derin sinir aglari ile hizli sonuclar cikarmak icin kullanilmaktadirDonanimLIDAR sensorlu bir 2020 model iPad Pro Pek cok tur bilgisayarli goru sistemi vardir ancak hepsi su temel ogeleri icermektedir bir guc kaynagi en az bir goruntu edinme cihazi kamera ccd vb bir islemci ve kontrol ve iletisim kablolari veya bir tur kablosuz ara baglanti mekanizmasi Ek olarak pratik bir gorsel denetim sistemi ve sistemi izlemek icin yazilimin yani sira bir ekran icermektedir Ic mekanlar icin goruntu sistemleri cogu endustriyel sistemde oldugu gibi bir aydinlatma sistemi icerir ve kontrollu bir ortama yerlestirilebilmektedir Ayrica tamamlanmis bir sistem kamera destekleri kablolar ve konektorler gibi bircok aksesuari icermektedir Cogu bilgisayarli goru sistemi bir sahneyi saniyede en fazla 60 kare genellikle cok daha yavas kare hizlarinda pasif olarak goruntuleyen gorunur isik kameralari kullanilmaktadir Birkac bilgisayarli goru sistemi yapilandirilmis isikli 3D tarayicilar termografik kameralar hiperspektral goruntuleyiciler radar goruntuleme lidar tarayicilar manyetik rezonans goruntuleri yandan taramali sonar gibi aktif aydinlatmali veya gorunur isiktan baska bir sey veya her ikisine sahip goruntu toplama donanimini kullanmaktadir Bu tur donanim gorunur isikli goruntuleri islemek icin kullanilan ayni bilgisayar gorme algoritmalari kullanilarak daha sonra siklikla islenen goruntuleri yakalamaktadir Geleneksel yayin ve tuketici video sistemleri saniyede 30 kare hizinda calisirken dijital sinyal isleme ve tuketici grafik donanimindaki gelismeler saniyede binlerce kare ile yuzlerce gercek zamanli sistemler icin yuksek hizli goruntu alma isleme ve goruntulemeyi mumkun kilmistir Robotikteki uygulamalar icin hizli gercek zamanli video sistemleri kritik oneme sahiptir ve genellikle belirli algoritmalar icin gerekli olan islemeyi basitlestirebilmistir Yuksek hizli bir projektorle birlestirildiginde hizli goruntu elde etme 3D olcumun ve ozellik izlemenin gerceklestirilmesine olanak tanimaktadir 2016 itibariyla goruntu isleme birimleri bu roldeki CPU lari ve grafik isleme birimlerini GPU tamamlamak icin yeni bir islemci sinifi olarak ortaya cikarmaktadir GelecegiTeknolojinin daha fazla arastirilmasi ve iyilestirilmesiyle bilgisayarli gorunun gelecegi icin daha genis bir islev yelpazesi gerceklestirdigini gosterecektir Yalnizca bilgisayarli goru teknolojilerinin egitilmesi daha kolay olmayacak ayni zamanda goruntulerden su anda oldugundan daha fazlasini ayirt edebilecektir Bilgisayarli goru daha guclu uygulamalar olusturmak icin diger teknolojilerle veya diger yapay zeka alt kumeleriyle birlikte kullanilabilecegi anlamina gelmektedir Ornegin resim yazisi olusturma uygulamalari cevredeki nesneleri gorme engelli kisiler icin yorumlamak icin dogal dil isleme ile birlestirilebilecektir Ayni zamanda yapay genel zeka ve yapay super zekanin gelistirilmesinde onlara bilgiyi insan gorsel sistemi kadar hatta daha iyi isleme yetenegi vererek hayati bir rol oynayacaktir Gunumuzun teknoloji yetenekleri dusunuldugunde kesfedilmemis kalan teknolojinin daha fazla faydasi ve uygulamasi olduguna inanmak zor olabilmektedir Bilgisayarli gorunun gelecegi bizim kadar insan olan yapay zeka sistemlerinin onunu acacaktir Bununla birlikte ustesinden gelinmesi gereken birkac zorluk var bunlarin en buyugu yapay zekanin kara kutusunun gizemini cozmektir Bunun nedeni tipki diger derin ogrenme uygulamalari gibi islevsel olarak etkili olmasina ragmen ic isleyisi soz konusu oldugunda bu teknolojinin cozulemez olmasidir Ayrica bakinizGorsel gradyanKaynakca a b Ballard Dana H 1982 Computer vision Christopher M Brown Englewood Cliffs N J Prentice Hall ISBN 0 13 165316 4 OCLC 7978044 5 Haziran 2020 tarihinde kaynagindan Erisim tarihi 23 Mayis 2021 a b Proceedings 1996 CERN School of Computing Egmond aan Zee the Netherlands 8 September 21 September 1996 C E Vandoni Cenevre CERN 1996 ISBN 92 9083 095 6 OCLC 36583267 19 Eylul 2019 tarihinde kaynagindan Erisim tarihi 23 Mayis 2021 a b Sonka Milan 2008 Image processing analysis and machine vision 3rd ed Vaclav Hlavac Roger Boyle Toronto Thompson Learning ISBN 0 495 08252 X OCLC 123776599 19 Eylul 2019 tarihinde kaynagindan Erisim tarihi 23 Mayis 2021 a b Klette Reinhard 2014 Concise computer vision an introduction into theory and algorithms Londra ISBN 978 1 4471 6320 6 OCLC 869222487 19 Eylul 2019 tarihinde kaynagindan Erisim tarihi 23 Mayis 2021 a b Shapiro Linda G 2001 Computer vision George C Stockman Upper Saddle River NJ Prentice Hall ISBN 0 13 030796 3 OCLC 45393572 19 Eylul 2019 tarihinde kaynagindan Erisim tarihi 23 Mayis 2021 Morris Tim 2004 Computer vision and image processing Basingstoke Palgrave Macmillan ISBN 0 333 99451 5 OCLC 52486158 19 Eylul 2019 tarihinde kaynagindan Erisim tarihi 23 Mayis 2021 a b Forsyth David 2003 Computer vision a modern approach Jean Ponce Upper Saddle River N J Prentice Hall ISBN 978 0 13 085198 7 OCLC 50100728 19 Eylul 2019 tarihinde kaynagindan Erisim tarihi 23 Mayis 2021 web archive org 16 Subat 2017 16 Subat 2017 tarihinde kaynagindan arsivlendi Erisim tarihi 22 Mayis 2021 X Prize seeks Star Trek style tricorder Physics Today 2012 doi 10 1063 pt 5 025816 ISSN 1945 0699 a b c d Szeliski Richard 2011 Computer vision algorithms and applications Londra Springer ISBN 978 1 84882 934 3 OCLC 682910466 19 Eylul 2019 tarihinde kaynagindan Erisim tarihi 23 Mayis 2021 Boden Margaret A 2008 Mind as machine a history of cognitive science 1st paperback ed Oxford Clarendon Press ISBN 978 0 19 954316 8 OCLC 370242127 19 Eylul 2019 tarihinde kaynagindan Erisim tarihi 23 Mayis 2021 Kanade Takeo 1987 Three Dimensional Machine Vision Boston MA Springer US ISBN 978 1 4613 1981 8 OCLC 852791356 Machine learning in computer vision Nicu Sebe Dordrecht Springer 2005 ISBN 978 1 4020 3275 2 OCLC 262677676 a b c International Journal of Computer Vision Springer Science and Business Media LLC Steger Carsten 2018 Machine vision algorithms and applications 2nd completely revised and enlarged Edition Markus Ulrich Christian Wiedemann Wiley VCH Weinheim Germany ISBN 978 3 527 41365 2 OCLC 1006724129 Murray D Jennings C Stereo vision based mapping and navigation for mobile robots Proceedings of International Conference on Robotics and Automation IEEE doi 10 1109 robot 1997 614387 ISBN 0 7803 3612 7 Soltani Amir Arsalan Huang Haibin Wu Jiajun Kulkarni Tejas D Tenenbaum Joshua B 10 Temmuz 2017 Synthesizing 3D Shapes via Modeling Multi view Depth Maps and Silhouettes with Deep Generative Networks 2017 IEEE Conference on Computer Vision and Pattern Recognition CVPR IEEE doi 10 1109 cvpr 2017 269 ISBN 978 1 5386 0457 1 Advances in computer vision help robots see Physics Today 2011 doi 10 1063 pt 5 025462 ISSN 1945 0699 Yoo J Borselen R V Mubarak M S Tsingas C 2019 Automated First Break Picking Method Using a Random Sample Consensus RANSAC 81st EAGE Conference and Exhibition 2019 European Association of Geoscientists amp Engineers doi 10 3997 2214 4609 201901195 Chervyakov N I Lyakhov P A Deryabin M A Nagornov N N Valueva M V Valuev G V 10 Eylul 2020 Residue Number System Based Solution for Reducing the Hardware Cost of a Convolutional Neural Network Neurocomputing 407 439 453 doi 10 1016 j neucom 2020 04 018 ISSN 0925 2312 Kaynak hatasi Gecersiz lt ref gt etiketi 3DVAE isimli refler icin metin saglanmadi Bkz Kaynak gosterme Zhou Huan Xiang 5 Kasim 2008 The debut of PMC Biophysics PMC Biophysics 1 1 doi 10 1186 1757 5036 1 1 ISSN 1757 5036 6 Haziran 2020 tarihinde kaynagindan Erisim tarihi 23 Mayis 2021 a b c Davies E R 2005 Machine vision theory algorithms practicalities 3rd ed Amsterdam Elsevier ISBN 978 0 08 047324 6 OCLC 162571652 Auteur Forsyth David A Computer vision a modern approach ISBN 978 1 292 01408 1 OCLC 1156470337 Erratum Methods in Ecology and Evolution 9 9 2041 2041 26 Temmuz 2018 doi 10 1111 2041 210x 13066 ISSN 2041 210X Soltani Amir Arsalan Huang Haibin Wu Jiajun Kulkarni Tejas D Tenenbaum Joshua B 1 Temmuz 2017 Synthesizing 3D Shapes via Modeling Multi view Depth Maps and Silhouettes with Deep Generative Networks 2017 IEEE Conference on Computer Vision and Pattern Recognition CVPR Honolulu HI IEEE 2511 2519 doi 10 1109 CVPR 2017 269 ISBN 978 1 5386 0457 1 23 Mayis 2021 tarihinde kaynagindan Erisim tarihi 23 Mayis 2021 Maity Abhishek 8 Subat 2016 Improvised Salient Object Detection and Manipulation International Journal of Image Graphics and Signal Processing 8 2 53 60 doi 10 5815 ijigsp 2016 02 07 ISSN 2074 9074 Encyclopedia of artificial intelligence 2nd ed Stuart Charles Shapiro New York Wiley 1992 ISBN 0 471 50307 X OCLC 24589928 Jun 2020 TechnologyTechGig Correspondent 22 Views 1876 01 41 PM TechGig 24 Mayis 2021 tarihinde kaynagindan arsivlendi Erisim tarihi 24 Mayis 2021 Kagami Shingo 1 Haziran 2010 High speed vision systems and projectors for real time perception of the world 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition Workshops IEEE doi 10 1109 cvprw 2010 5543776 ISBN 978 1 4244 7029 7 Ionica Mircea Horea Gregg David 1 Ocak 2015 The Movidius Myriad Architecture s Potential for Scientific Computing IEEE Micro 35 1 6 14 doi 10 1109 mm 2015 4 ISSN 0272 1732 a b Joshi Naveen Forbes Ingilizce 27 Haziran 2019 tarihinde kaynagindan arsivlendi Erisim tarihi 24 Mayis 2021