ทีมวิจัยของ NVIDIA Research Center ได้ให้ความสำคัญกับการผลักดันขอบเขตของเทคโนโลยีในการเรียนรู้ด้วยคอมพิวเตอร์การมองเห็นด้วยคอมพิวเตอร์รถยนต์ที่ขับเคลื่อนด้วยตนเองหุ่นยนต์กราฟิกสถาปัตยกรรมคอมพิวเตอร์ระบบการเขียนโปรแกรมและอื่น ๆ
แม้ว่าจะทำงานในสาขาต่างๆ แต่ก็มีเป้าหมายร่วมกัน: พัฒนาวิทยาศาสตร์ AI สร้างเครื่องมือและเทคโนโลยีใหม่ ๆ ที่จะนำไปสู่นวัตกรรมใหม่ ๆ และใช้ AI ในการสร้างความท้าทายในยุคใหม่ ๆ เช่นรถยนต์ที่เป็นอิสระและการดูแลสุขภาพ
ความก้าวหน้าอย่างหนึ่งคืองานที่นำเสนอในบทความเรื่อง "Learning Affinity via Sourcesi propagand Networks" ซึ่งนำโดย Sifei Liu ซึ่งเป็นนักศึกษาฝึกงานที่ NVIDIA เพียงช่วงฤดูร้อนที่ผ่านมาและตอนนี้ทำงานเต็มเวลาในฐานะนักวิจัย
สำหรับแอ็พพลิเคชันการมองเห็นด้วยคอมพิวเตอร์เพื่อทำความเข้าใจกับภาพจำเป็นต้องระบุและระบุว่าพิกเซลต่างๆแสดงอะไร ตัวอย่างเช่นพิกเซลที่อยู่ในภาพอยู่ในยางของรถจักรยานหรือกรอบหรือต้นไม้ที่จักรยานพิงอยู่ งานนี้เรียกว่าการแบ่งส่วนภาพและเครือข่ายการแพร่กระจายเชิงพื้นที่มีความสามารถในการทำสิ่งนี้ได้อย่างถูกต้องและมีประสิทธิภาพ
เครือข่ายการ Deep Learning ใช้หลักการฟิสิกส์ที่ดีในการแพร่กระจายเพื่อให้เข้าใจถึงความสัมพันธ์ระหว่างพิกเซลที่อยู่ใกล้เคียงได้ดีขึ้น ซึ่งจะช่วยให้สามารถแยกแยะตัวอย่างเช่นระหว่างพิกเซลที่อยู่ใกล้เคียงของล้อจักรยานซี่โครงและพื้นที่ว่างระหว่าง นี่คือความสัมพันธ์เชิงพื้นที่สำหรับการแบ่งส่วนภาพ แต่เครือข่ายอาจได้รับการฝึกอบรมเพื่อกำหนดความสัมพันธ์อื่น ๆ : สีโทนเนื้อ ฯลฯ
เครือข่ายการแพร่กระจายเชิงพื้นที่ได้เรียนรู้เพื่อกำหนดและจำลองความสัมพันธ์เหล่านี้โดยใช้ข้อมูลเพียงอย่างเดียวแทนที่จะเป็นแบบจำลองที่ออกแบบด้วยมือ และรูปแบบการเรียนรู้สามารถใช้กับงานที่ต้องใช้ป้ายชื่อระดับพิกเซลรวมถึงการปูแผ่นภาพ การทำสีของภาพ
และการแยกวิเคราะห์ใบหน้าเพื่อตั้งชื่อ นอกจากนี้โมเดลยังสามารถอธิบายความสัมพันธ์ระหว่างกันเช่นความสัมพันธ์ในแง่ของการทำงานหรือความหมายในภาพซึ่งอาจไม่ได้เกิดขึ้นกับผู้คน
นี้รวมถึงทฤษฎีพื้นฐานของการดำเนินงานของเครือข่ายประสาทพร้อมกับหลักฐานทางคณิตศาสตร์ของการใช้งาน และรวดเร็ว การทำงานบน GPUs ด้วยรูปแบบการเขียนโปรแกรมแบบขนาน CUDA เครือข่ายจะเร็วกว่าที่เป็นไปได้ก่อนหน้านี้ได้ถึง 100 เท่า
เครือข่ายการแพร่กระจายเชิงพื้นที่ไม่จำเป็นต้องมีการแก้สมการเชิงเส้นหรือการอนุมานแบบอิงค์เจ็ต และมีความยืดหยุ่นเพียงพอที่จะแทรกเข้าไปในเครือข่ายประสาทเทียมแบบใดก็ได้ทำให้เป็นเทคโนโลยีที่มีศักยภาพสำหรับการใช้งานในหลาย ๆ สถานการณ์
จนถึงปัจจุบัน Deep Learning ได้ใช้การเรียนรู้ที่ได้รับการควบคุมเพื่อให้เครื่องมีความสามารถในการรับรู้ความสามารถของมนุษย์ ตัวอย่างเช่นการเรียนรู้ที่ได้รับการดูแลสามารถทำผลงานได้ดีและบอกถึงความแตกต่าง
เพื่อให้เครื่องจักรมีความสามารถในเชิงจินตนาการมากยิ่งขึ้นเช่นการจินตนาการว่าช่วงฤดูหนาวจะมีลักษณะอย่างไรในช่วงฤดูร้อนจะเป็นอย่างไรและทีมวิจัยใช้การเรียนรู้และการสร้างแบบจำลอง ตัวอย่างของงานของพวกเขาแสดงไว้ด้านล่างซึ่งทางด้านซ้ายอยู่ในช่วงฤดูหนาวและฉากทางด้านขวาที่มีแสงจ้าและช่วงฤดูร้อนกลายเป็นฤดูฝน
งานของทีมวิจัยของ NVIDIA ใช้คู่ของเครือข่ายความขัดแย้งเชิงกล (Generative adversarial networks (GAN) ที่มีสมมติฐานพื้นที่แฝงที่ใช้ร่วมกันเพื่อให้ได้ผลที่น่าทึ่งเหล่านี้ เมื่อพิจารณาภาพด้านบนสองภาพข้างต้น GAN คนแรกจะได้รับการฝึกฝนในฉากฤดูหนาว - ท้องฟ้ามืดครึ้มต้นไม้เปลือยหิมะปกคลุมทุกสิ่งทุกอย่าง แต่รถแล่นลงบนถนนที่แช่แข็ง GAN ที่สองได้รับการฝึกฝนเพื่อทำความเข้าใจโดยทั่วไปว่าช่วงฤดูร้อนมีลักษณะอย่างไร
และวิธีการได้หรือไม่ คุณต้องใช้ภาพเดียวกันที่บันทึกจากจุดชมวิวเดียวกันโดยมีมุมมองเดียวกันและมีข้อมูลการจราจรที่กำลังมาถึงและรายละเอียดอื่น ๆ ในตำแหน่งเดียวกันทั้งหมดสำหรับทั้งฤดูร้อนและฤดูหนาว
การใช้ GAN ไม่ใช่เรื่องแปลกใหม่ในการเรียนรู้ แต่การวิจัยของ NVIDIA ก็ทำให้ได้ผลลัพธ์ที่ดี


ไม่มีความคิดเห็น:
แสดงความคิดเห็น