วิธีเพิ่มการเรียนรู้ของเครื่องไปยังแอพ Android ของคุณ

ผู้เขียน: Peter Berry
วันที่สร้าง: 16 สิงหาคม 2021
วันที่อัปเดต: 1 กรกฎาคม 2024
Anonim
แชร์ 4 แอพฝึกภาษาฟรี! มีติดเครื่องไว้เล่นเพลินๆ ความรู้เพียบ! | LDA World
วิดีโอ: แชร์ 4 แอพฝึกภาษาฟรี! มีติดเครื่องไว้เล่นเพลินๆ ความรู้เพียบ! | LDA World

เนื้อหา


การเรียนรู้ของเครื่อง (ML) สามารถช่วยคุณสร้างประสบการณ์ที่แปลกใหม่น่าสนใจและเป็นเอกลักษณ์สำหรับผู้ใช้มือถือของคุณ

เมื่อคุณเชี่ยวชาญ ML คุณสามารถใช้มันเพื่อสร้างแอพพลิเคชั่นที่หลากหลายรวมถึงแอพที่จัดระเบียบรูปภาพตามหัวข้อของพวกเขาโดยอัตโนมัติระบุและติดตามใบหน้าของบุคคลผ่านทางสตรีมสดดึงข้อความจากรูปภาพและอีกมากมาย .

แต่ ML นั้นไม่ได้เป็นมิตรสำหรับผู้เริ่มต้น! หากคุณต้องการพัฒนาแอพ Android ของคุณด้วยความสามารถในการเรียนรู้ของเครื่องที่ทรงพลังแล้วคุณจะเริ่มต้นตรงไหน?

ในบทความนี้ฉันจะให้ภาพรวมของ SDK (ชุดพัฒนาซอฟต์แวร์) ที่สัญญาว่าจะเพิ่มพลังของ ML ไว้ที่ปลายนิ้วของคุณแม้ว่าคุณจะมี ศูนย์ ประสบการณ์ ML ในตอนท้ายของบทความนี้คุณจะมีพื้นฐานที่คุณต้องเริ่มต้นสร้างแอปอัจฉริยะที่ขับเคลื่อนด้วย ML ที่สามารถติดฉลากภาพสแกนบาร์โค้ดจดจำใบหน้าและสถานที่สำคัญที่มีชื่อเสียงและดำเนินการ ML ที่ทรงพลังอื่น ๆ

พบกับชุดการเรียนรู้ของเครื่อง

ด้วยการเปิดตัวเทคโนโลยีเช่น TensorFlow และ CloudVision ทำให้ ML กลายเป็นที่ใช้กันอย่างแพร่หลายมากขึ้น แต่เทคโนโลยีเหล่านี้ไม่ได้เป็นที่สนใจอีกต่อไป! โดยทั่วไปคุณจะต้องมีความเข้าใจอย่างลึกซึ้งเกี่ยวกับเครือข่ายประสาทและการวิเคราะห์ข้อมูลเพื่อรับ เริ่มต้น ด้วยเทคโนโลยีเช่น TensorFlow


แม้ว่าคุณจะ ทำ มีประสบการณ์เกี่ยวกับ ML การสร้างแอพมือถือที่ขับเคลื่อนด้วยการเรียนรู้ด้วยเครื่องจักรอาจต้องใช้เวลากระบวนการที่ซับซ้อนและมีค่าใช้จ่ายสูงซึ่งคุณจะต้องจัดหาแหล่งข้อมูลที่เพียงพอในการฝึกอบรม ML รุ่นของคุณเอง สภาพแวดล้อมมือถือ หากคุณเป็นนักพัฒนารายบุคคลหรือมีทรัพยากร จำกัด อาจเป็นไปไม่ได้ที่จะนำความรู้ ML ของคุณไปใช้ในทางปฏิบัติ

ML Kit เป็นความพยายามของ Google ในการนำเครื่องมือเรียนรู้สู่มวลชน

ภายใต้ฮูดนั้น ML Kit รวมเทคโนโลยี ML ที่ทรงพลังหลายตัวเข้าด้วยกันซึ่งโดยทั่วไปแล้วจะต้องมีความรู้ ML ที่กว้างขวางรวมถึง Cloud Vision, TensorFlow และ Android Neural Networks API ML Kit รวมเทคโนโลยี ML ผู้เชี่ยวชาญเหล่านี้เข้ากับโมเดลที่ได้รับการฝึกฝนมาแล้วสำหรับเคสมือถือทั่วไปซึ่งรวมถึงการแยกข้อความจากภาพสแกนบาร์โค้ดและระบุเนื้อหาของภาพถ่าย

ไม่ว่าคุณจะมีความรู้เกี่ยวกับ ML มาก่อนหรือไม่คุณสามารถใช้ ML Kit เพื่อเพิ่มความสามารถในการเรียนรู้ของเครื่องที่มีประสิทธิภาพให้กับ Android ของคุณ และ แอพ iOS เพียงแค่ส่งข้อมูลไปยังส่วนที่ถูกต้องของ ML Kit เช่น API การรู้จำข้อความหรือการระบุภาษา API และ API นี้จะใช้การเรียนรู้ของเครื่องเพื่อตอบกลับ


ฉันจะใช้ ML Kit API ได้อย่างไร

ML Kit แบ่งออกเป็นหลาย API ที่เผยแพร่เป็นส่วนหนึ่งของแพลตฟอร์ม Firebase หากต้องการใช้ ML Kit API ใด ๆ คุณจะต้องสร้างการเชื่อมต่อระหว่างโครงการ Android Studio ของคุณกับโครงการ Firebase ที่เกี่ยวข้องจากนั้นสื่อสารกับ Firebase

รุ่น ML Kit ส่วนใหญ่มีให้บริการในรุ่นอุปกรณ์ที่คุณสามารถดาวน์โหลดและใช้ในพื้นที่ได้ แต่บางรุ่นมีให้ใช้ในระบบคลาวด์ด้วยซึ่งช่วยให้แอปของคุณสามารถทำงานที่ขับเคลื่อนด้วย ML ผ่านการเชื่อมต่ออินเทอร์เน็ตของอุปกรณ์

แต่ละวิธีมีชุดของจุดแข็งและจุดอ่อนที่เป็นเอกลักษณ์ของตัวเองดังนั้นคุณจะต้องตัดสินใจว่าการประมวลผลในท้องถิ่นหรือระยะไกลเหมาะสมกับแอปเฉพาะของคุณหรือไม่ คุณสามารถเพิ่มการสนับสนุนสำหรับทั้งสองรุ่นและอนุญาตให้ผู้ใช้ของคุณตัดสินใจว่าจะใช้รุ่นใดในรันไทม์ หรือคุณอาจกำหนดค่าแอปของคุณเพื่อเลือกรุ่นที่ดีที่สุดสำหรับเงื่อนไขปัจจุบันตัวอย่างเช่นใช้เฉพาะรุ่น Cloud-Based เมื่ออุปกรณ์เชื่อมต่อกับ Wi-Fi

หากคุณเลือกรุ่นท้องถิ่นคุณลักษณะการเรียนรู้ของเครื่องของแอปจะพร้อมใช้งานเสมอไม่ว่าผู้ใช้จะมีการเชื่อมต่ออินเทอร์เน็ตหรือไม่ เนื่องจากทำงานทั้งหมดในพื้นที่แบบจำลองบนอุปกรณ์จึงเหมาะอย่างยิ่งเมื่อแอปของคุณต้องการประมวลผลข้อมูลจำนวนมากอย่างรวดเร็วตัวอย่างเช่นหากคุณใช้ ML Kit เพื่อจัดการสตรีมวิดีโอสด

ในขณะเดียวกันแบบจำลองบนคลาวด์จะให้ความแม่นยำมากกว่าแบบจำลองบนอุปกรณ์เนื่องจากโมเดลคลาวด์ใช้ประโยชน์จากเทคโนโลยีการเรียนรู้ของเครื่องบนแพลตฟอร์มคลาวด์ของ Google ตัวอย่างเช่นรูปแบบบนอุปกรณ์ของ Image Labeling API มี 400 ป้ายกำกับ แต่รุ่นคลาวด์มีคุณลักษณะมากกว่า 10,000 ป้าย.

อาจมีฟังก์ชั่นบางอย่างที่มีเฉพาะในระบบคลาวด์เท่านั้นตัวอย่างเช่น API การรับรู้ข้อความสามารถระบุอักขระที่ไม่ใช่ละตินได้หากคุณใช้แบบจำลองคลาวด์

API บนคลาวด์มีให้บริการเฉพาะสำหรับโครงการ Firebase ระดับ Blaze ดังนั้นคุณจะต้องอัปเกรดเป็นแผน Blaze แบบจ่ายตามการใช้งานก่อนที่คุณจะสามารถใช้โมเดลคลาวด์ของ ML Kit ได้

หากคุณตัดสินใจที่จะสำรวจโมเดลคลาวด์ดังนั้นในขณะที่เขียนมีโควต้าฟรีสำหรับ ML Kit API ทั้งหมด หากคุณเพียงแค่ต้องการทดสอบด้วยการติดป้ายกำกับภาพบนคลาวด์คุณสามารถอัปเกรดโครงการ Firebase เป็นแผน Blaze ทดสอบ API บนภาพน้อยกว่า 1,000 ภาพแล้วเปลี่ยนกลับไปใช้แผน Spark ฟรีโดยไม่ต้องเสียค่าใช้จ่าย อย่างไรก็ตามข้อกำหนดและเงื่อนไขมีนิสัยที่น่ารังเกียจในการเปลี่ยนแปลงเมื่อเวลาผ่านไปดังนั้นโปรดอ่านสิ่งพิมพ์ขนาดเล็กก่อนที่จะอัปเกรดเป็น Blaze เพื่อให้แน่ใจว่าคุณจะไม่โดนเงินที่ไม่คาดคิด!

ระบุข้อความในภาพใด ๆ ด้วย Text Recognition API

Text Recognition API สามารถระบุวิเคราะห์และประมวลผลข้อความได้อย่างชาญฉลาด

คุณสามารถใช้ API นี้เพื่อสร้างแอปพลิเคชันที่ดึงข้อความจากรูปภาพดังนั้นผู้ใช้ของคุณไม่ต้องเสียเวลากับการป้อนข้อมูลด้วยตนเองที่น่าเบื่อ ตัวอย่างเช่นคุณอาจใช้ Text Recognition API เพื่อช่วยให้ผู้ใช้ของคุณแยกและบันทึกข้อมูลจากใบเสร็จรับเงินใบแจ้งหนี้นามบัตรหรือฉลากโภชนาการเพียงแค่ถ่ายภาพของรายการที่เป็นปัญหา

คุณสามารถใช้ Text Recognition API เป็นขั้นตอนแรกในแอพการแปลซึ่งผู้ใช้ถ่ายภาพข้อความที่ไม่คุ้นเคยและ API จะดึงข้อความทั้งหมดจากรูปภาพพร้อมที่จะส่งผ่านไปยังบริการแปลภาษา

API การรู้จำข้อความบนอุปกรณ์ของ ML Kit สามารถระบุข้อความในภาษาละตินใด ๆ ในขณะที่ Cloud-Based นั้นสามารถจดจำภาษาและอักขระที่หลากหลายได้มากขึ้นรวมถึงตัวอักษรจีนญี่ปุ่นและเกาหลี แบบจำลองบนคลาวด์ยังได้รับการปรับแต่งเพื่อแยกข้อความกระจัดกระจายออกจากรูปภาพและข้อความจากเอกสารที่อัดแน่นซึ่งคุณควรคำนึงถึงเมื่อตัดสินใจเลือกรุ่นที่จะใช้ในแอปของคุณ

ต้องการประสบการณ์ตรงกับ API นี้ไหม จากนั้นตรวจสอบคำแนะนำทีละขั้นตอนของเราเพื่อสร้างแอปพลิเคชันที่สามารถแยกข้อความจากภาพใด ๆ โดยใช้ API การจดจำข้อความ

ทำความเข้าใจกับเนื้อหาของรูปภาพ: Image Labeling API

API การติดฉลากรูปภาพสามารถจดจำเอนทิตีในภาพรวมถึงสถานที่ผู้คนผลิตภัณฑ์และสัตว์โดยไม่จำเป็นต้องมีข้อมูลเมตาเพิ่มเติมตามบริบท Image Labeling API จะส่งคืนข้อมูลเกี่ยวกับเอนทิตีที่ตรวจพบในรูปแบบของป้ายกำกับ ตัวอย่างเช่นในภาพหน้าจอต่อไปนี้ฉันได้จัดเตรียมภาพถ่ายธรรมชาติให้กับ API และตอบกลับด้วยป้ายกำกับเช่น "ป่า" และ "แม่น้ำ"

ความสามารถในการรับรู้เนื้อหาของรูปภาพสามารถช่วยคุณสร้างแอปที่ติดแท็กรูปภาพตามหัวข้อของพวกเขา ตัวกรองที่ระบุเนื้อหาที่ผู้ใช้ส่งไม่เหมาะสมโดยอัตโนมัติและลบออกจากแอปของคุณ หรือเป็นพื้นฐานสำหรับฟังก์ชั่นการค้นหาขั้นสูง

ML Kit APIs จำนวนมากส่งคืนผลลัพธ์ที่เป็นไปได้หลายรายการพร้อมคะแนนความเชื่อมั่นที่แนบมารวมถึง API การติดฉลากรูปภาพ หากคุณส่งรูปภาพฉลากของพุดเดิ้ลรูปภาพอาจส่งคืนป้ายกำกับเช่น "พุดเดิ้ล" "สุนัข" "สัตว์เลี้ยง" และ "สัตว์เล็ก" ซึ่งทั้งหมดมีคะแนนแตกต่างกันซึ่งบ่งบอกถึงความเชื่อมั่นของ API ในแต่ละฉลาก หวังว่าในสถานการณ์นี้“ พุดเดิ้ล” จะมีคะแนนความมั่นใจสูงสุด!

คุณสามารถใช้คะแนนความเชื่อมั่นนี้เพื่อสร้างเกณฑ์ที่จะต้องปฏิบัติตามก่อนที่แอปพลิเคชันของคุณจะทำงานกับป้ายกำกับใด ๆ ตัวอย่างเช่นแสดงให้ผู้ใช้เห็นหรือติดแท็กภาพถ่ายด้วยป้ายกำกับนี้

การติดฉลากรูปภาพสามารถใช้ได้ทั้งบนอุปกรณ์และในระบบคลาวด์แม้ว่าคุณจะเลือกใช้แบบจำลองคลาวด์คุณจะสามารถเข้าถึงฉลากได้มากกว่า 10,000 ป้ายเมื่อเทียบกับป้ายกำกับ 400 รายการที่รวมอยู่ในรุ่นอุปกรณ์

หากต้องการข้อมูลเชิงลึกเพิ่มเติมเกี่ยวกับ Image Labeling API ให้ตรวจสอบเนื้อหาของภาพด้วยการเรียนรู้ของเครื่อง ในบทความนี้เราสร้างแอปพลิเคชันที่ประมวลผลภาพจากนั้นส่งคืนฉลากและคะแนนความเชื่อมั่นสำหรับแต่ละเอนทิตีที่ตรวจพบภายในภาพนั้น นอกจากนี้เรายังใช้โมเดลอุปกรณ์และคลาวด์ในแอพนี้เพื่อให้คุณเห็นได้อย่างชัดเจนว่าผลลัพธ์แตกต่างกันอย่างไรขึ้นอยู่กับรุ่นที่คุณเลือก

การทำความเข้าใจการแสดงออกและการติดตามใบหน้า: API การตรวจจับใบหน้า

API การตรวจจับใบหน้าสามารถค้นหาใบหน้ามนุษย์ในภาพถ่ายวิดีโอและสตรีมสดจากนั้นดึงข้อมูลเกี่ยวกับแต่ละใบหน้าที่ตรวจพบรวมถึงตำแหน่งขนาดและการวางแนว

คุณสามารถใช้ API นี้เพื่อช่วยให้ผู้ใช้แก้ไขรูปภาพของพวกเขาเช่นโดยการครอบตัดพื้นที่ว่างเปล่ารอบ ๆ ภาพหัวล่าสุดของพวกเขาโดยอัตโนมัติ

API การตรวจจับใบหน้าไม่ได้ จำกัด อยู่ที่รูปภาพ - คุณสามารถใช้ API นี้กับวิดีโอได้เช่นคุณอาจสร้างแอปที่ระบุใบหน้าทั้งหมดในฟีดวิดีโอแล้วเบลอทุกอย่าง ยกเว้น ใบหน้าเหล่านั้นคล้ายกับคุณสมบัติเบลอพื้นหลังของ Skype

การตรวจจับใบหน้าคือ เสมอ ดำเนินการบนอุปกรณ์ซึ่งเร็วพอที่จะใช้ในแบบเรียลไทม์ดังนั้นไม่เหมือนกับ API ส่วนใหญ่ของ ML Kit ของ Face Detection ไม่ รวมถึงรูปแบบคลาวด์

นอกเหนือจากการตรวจจับใบหน้า API นี้ยังมีคุณสมบัติเพิ่มเติมบางอย่างที่ควรค่าแก่การสำรวจ ประการแรก API การตรวจจับใบหน้าสามารถระบุสถานที่สำคัญบนใบหน้าเช่นตาริมฝีปากและหูแล้วดึงข้อมูลพิกัดที่แน่นอนสำหรับแต่ละจุดสังเกตเหล่านี้ นี้ การจดจำสถานที่สำคัญ มอบแผนที่ที่แม่นยำของแต่ละใบหน้าที่ตรวจจับได้ - เหมาะสำหรับการสร้างแอพที่เติมความเป็นจริง (AR) ที่เพิ่มมาสก์และตัวกรองสไตล์ Snapchat ไปยังฟีดกล้องของผู้ใช้

API การตรวจจับใบหน้ายังนำเสนอใบหน้า การจัดหมวดหมู่. ปัจจุบัน ML Kit รองรับการจำแนกใบหน้าสองแบบ: เปิดตาและยิ้ม

คุณสามารถใช้การจำแนกประเภทนี้เป็นพื้นฐานสำหรับบริการการเข้าถึงเช่นการควบคุมแบบแฮนด์ฟรีหรือเพื่อสร้างเกมที่ตอบสนองต่อการแสดงออกทางสีหน้าของผู้เล่น ความสามารถในการตรวจจับว่ามีใครบางคนยิ้มหรือมีตาที่เปิดอยู่สามารถมีประโยชน์ได้ถ้าคุณกำลังสร้างแอพกล้องถ่ายรูป - หลังจากทั้งหมดไม่มีอะไรที่เลวร้ายไปกว่าการถ่ายรูปหลายภาพ แต่หลังจากนั้นก็พบว่ามีคนหลับตา ใน ทุกช็อตเดียว

ในที่สุด API การตรวจจับใบหน้าประกอบด้วยส่วนประกอบการติดตามใบหน้าซึ่งกำหนด ID ให้กับใบหน้าจากนั้นติดตามใบหน้านั้นในรูปภาพหรือเฟรมวิดีโอที่ต่อเนื่องกันหลายภาพ โปรดทราบว่านี่คือใบหน้า การติดตาม และไม่ใช่ใบหน้าที่แท้จริง ได้รับการยอมรับ. เบื้องหลังการค้นหา API การตรวจจับใบหน้ากำลังติดตามตำแหน่งและการเคลื่อนไหวของใบหน้าจากนั้นอนุมานว่าใบหน้านี้น่าจะเป็นของคนคนเดียวกัน แต่ท้ายที่สุดมันก็ไม่รู้ตัวตนของบุคคลนั้น

ลองใช้ Face Detection API ด้วยตัวคุณเอง! ค้นหาวิธีสร้างแอปตรวจจับใบหน้าด้วยการเรียนรู้ของเครื่องและ Firebase ML Kit

การสแกนบาร์โค้ดด้วย Firebase และ ML

การสแกนบาร์โค้ดอาจไม่น่าตื่นเต้นเท่าที่ API การเรียนรู้ของเครื่องอื่น ๆ แต่เป็นส่วนที่เข้าถึงได้ง่ายที่สุดของ ML Kit

การสแกนบาร์โค้ดไม่จำเป็นต้องใช้ฮาร์ดแวร์หรือซอฟต์แวร์ผู้เชี่ยวชาญดังนั้นคุณสามารถใช้ Barcode Scanning API ในขณะที่มั่นใจได้ว่าแอปของคุณยังคงเข้าถึงได้สำหรับคนจำนวนมากที่สุดเท่าที่จะเป็นไปได้รวมถึงผู้ใช้ในอุปกรณ์รุ่นเก่าหรืองบประมาณ ตราบใดที่อุปกรณ์มีกล้องใช้งานก็ไม่น่าจะมีปัญหาในการสแกนบาร์โค้ด

Barcode Scanning API ของ ML Kit สามารถดึงข้อมูลที่หลากหลายจากบาร์โค้ดที่พิมพ์และดิจิตอลซึ่งทำให้เป็นวิธีที่รวดเร็วง่ายดายและเข้าถึงได้ในการส่งผ่านข้อมูลจากโลกแห่งความจริงไปยังแอปพลิเคชันของคุณโดยที่ผู้ใช้ไม่ต้องป้อนข้อมูล .

มีชนิดข้อมูลเก้าชนิดที่ API สแกนบาร์โค้ดสามารถรับรู้และแยกวิเคราะห์จากบาร์โค้ด:

  • TYPE_CALENDAR_EVENT ข้อมูลนี้มีข้อมูลเช่นตำแหน่งของผู้จัดงานและเวลาเริ่มต้นและสิ้นสุดหากคุณกำลังโปรโมตกิจกรรมคุณอาจรวมบาร์โค้ดที่พิมพ์บนโปสเตอร์หรือใบปลิวของคุณหรือแสดงบาร์โค้ดดิจิทัลในเว็บไซต์ของคุณ ผู้เข้าร่วมประชุมที่มีศักยภาพสามารถดึงข้อมูลทั้งหมดเกี่ยวกับกิจกรรมของคุณเพียงแค่สแกนบาร์โค้ด
  • TYPE_CONTACT_INFO ประเภทข้อมูลนี้ครอบคลุมข้อมูลเช่นที่อยู่อีเมลชื่อหมายเลขโทรศัพท์และชื่อของผู้ติดต่อ
  • TYPE_DRIVER_LICENSE ข้อมูลนี้มีข้อมูลเช่นถนนเมืองรัฐชื่อและวันเดือนปีเกิดที่เกี่ยวข้องกับใบขับขี่
  • TYPE_EMAIL ประเภทข้อมูลนี้มีที่อยู่อีเมลรวมถึงหัวเรื่องของอีเมลและข้อความเนื้อหา
  • TYPE_GEO สิ่งนี้มีละติจูดและลองจิจูดสำหรับจุดภูมิศาสตร์เฉพาะซึ่งเป็นวิธีที่ง่ายในการแชร์ตำแหน่งกับผู้ใช้ของคุณหรือเพื่อให้พวกเขาแชร์ตำแหน่งกับผู้อื่น คุณยังสามารถใช้บาร์โค้ดทางภูมิศาสตร์เพื่อเรียกใช้เหตุการณ์ตามตำแหน่งเช่นการแสดงข้อมูลที่เป็นประโยชน์เกี่ยวกับตำแหน่งปัจจุบันของผู้ใช้หรือเป็นพื้นฐานสำหรับเกมมือถือตามตำแหน่งที่ตั้ง
  • TYPE_PHONE ประกอบด้วยหมายเลขโทรศัพท์และประเภทของหมายเลขเช่นไม่ว่าจะเป็นที่ทำงานหรือหมายเลขโทรศัพท์บ้าน
  • TYPE_SMS ข้อความนี้ประกอบด้วยข้อความเนื้อหา SMS และหมายเลขโทรศัพท์ที่เกี่ยวข้องกับ SMS
  • TYPE_URL ประเภทข้อมูลนี้มี URL และชื่อของ URL การสแกนบาร์โค้ด TYPE_URL นั้นง่ายกว่าการพึ่งพาผู้ใช้ของคุณในการพิมพ์ URL ที่ยาวและซับซ้อนด้วยตนเองโดยไม่ต้องพิมพ์ผิดหรือสะกดผิด
  • TYPE_WIFI สิ่งนี้มี SSID และรหัสผ่านของเครือข่าย Wi-Fi รวมถึงประเภทการเข้ารหัสเช่น OPEN, WEP หรือ WPA บาร์โค้ด Wi-Fi เป็นวิธีที่ง่ายที่สุดวิธีหนึ่งในการแบ่งปันข้อมูลรับรอง Wi-Fi ในขณะเดียวกันก็ช่วยลดความเสี่ยงของผู้ใช้ในการป้อนข้อมูลนี้อย่างไม่ถูกต้อง

API การสแกนบาร์โค้ดสามารถแยกวิเคราะห์ข้อมูลจากบาร์โค้ดหลากหลายประเภทรวมถึงรูปแบบเชิงเส้นเช่น Codabar, รหัส 39, EAN-8, ITF, และ UPC-A และรูปแบบ 2D เช่น Aztec, Data Matrix และ QR Codes

เพื่อให้ผู้ใช้ปลายทางของคุณง่ายขึ้น API นี้จะสแกนบาร์โค้ดที่รองรับทั้งหมดพร้อมกันและยังสามารถดึงข้อมูลโดยไม่คำนึงถึงทิศทางของบาร์โค้ดดังนั้นจึงไม่สำคัญว่าบาร์โค้ดจะกลับหัวกลับหางอย่างสมบูรณ์เมื่อผู้ใช้สแกน!

การเรียนรู้ของเครื่องในคลาวด์: API การจดจำสถานที่

คุณสามารถใช้ Landmark Recognition API ของ ML Kit เพื่อระบุสถานที่สำคัญทางธรรมชาติและสร้างขึ้นภายในรูปภาพ

หากคุณผ่าน API นี้ภาพที่มีสถานที่สำคัญที่มีชื่อเสียงก็จะส่งคืนชื่อสถานที่นั้น ๆ ค่าละติจูดและลองจิจูดของสถานที่สำคัญและกล่องขอบเขตที่ระบุว่ามีการค้นพบสถานที่สำคัญใดในภาพ

คุณสามารถใช้ Landmark Recognition API เพื่อสร้างแอพพลิเคชั่นที่ติดแท็กรูปถ่ายของผู้ใช้โดยอัตโนมัติหรือเพื่อมอบประสบการณ์ที่กำหนดเองมากขึ้นตัวอย่างเช่นหากแอปของคุณรับรู้ว่าผู้ใช้กำลังถ่ายภาพของหอไอเฟล สถานที่สำคัญนี้หรือแนะนำสถานที่ท่องเที่ยวใกล้เคียงที่คล้ายกันซึ่งผู้ใช้อาจต้องการเยี่ยมชมต่อไป

สำหรับชุดคิท ML ที่ผิดปกตินั้น Landmark Detection API นั้นจะมีให้ในรูปแบบ Cloud-based API เท่านั้นดังนั้นแอปพลิเคชันของคุณจะสามารถตรวจจับจุดสังเกตได้เมื่ออุปกรณ์นั้นมีการเชื่อมต่ออินเทอร์เน็ตที่ใช้งานได้

API การระบุภาษา: การพัฒนาสำหรับผู้ชมต่างประเทศ

ทุกวันนี้แอป Android ถูกใช้งานในทุกส่วนของโลกโดยผู้ใช้ที่พูดภาษาต่าง ๆ มากมาย

API การระบุภาษาของ ML Kit สามารถช่วยให้แอพ Android ของคุณดึงดูดผู้ชมต่างประเทศได้โดยการใส่ข้อความและกำหนดภาษาที่ใช้เขียน API การระบุภาษาสามารถระบุภาษาต่าง ๆ ได้กว่าร้อยภาษารวมถึงข้อความโรมันสำหรับภาษาอาหรับบัลแกเรีย จีน, กรีก, ฮินดี, ญี่ปุ่นและรัสเซีย

API นี้เป็นส่วนเสริมที่มีค่าสำหรับแอปพลิเคชันใด ๆ ที่ประมวลผลข้อความที่ผู้ใช้จัดหาเนื่องจากข้อความนี้ไม่ค่อยมีข้อมูลภาษาใด ๆ คุณอาจใช้ API การระบุภาษาในแอปแปลเป็นขั้นตอนแรกในการแปล สิ่งใดกำลังรู้ภาษาที่คุณใช้ด้วย! ตัวอย่างเช่นหากผู้ใช้เล็งกล้องของอุปกรณ์ไปที่เมนูแอปของคุณอาจใช้ Language Identification API เพื่อตรวจสอบว่าเมนูเขียนเป็นภาษาฝรั่งเศสแล้วเสนอให้แปลเมนูนี้โดยใช้บริการเช่น Cloud Translation API ( บางทีหลังจากคลายข้อความโดยใช้ Text Recognition API?)

API การระบุภาษาอาจส่งคืนภาษาที่มีศักยภาพหลายภาษาพร้อมด้วยคะแนนความมั่นใจทั้งนี้ขึ้นอยู่กับสตริงที่มีปัญหาเพื่อให้คุณสามารถกำหนดได้ว่าภาษาใดที่ตรวจพบได้น่าจะถูกต้องมากที่สุด โปรดทราบว่าในขณะที่เขียน ML Kit จะไม่สามารถระบุภาษาที่แตกต่างกันหลายรายการภายในสตริงเดียวกัน

เพื่อให้มั่นใจว่า API นี้มีการระบุภาษาแบบเรียลไทม์ API การระบุภาษาจะมีให้เฉพาะในรุ่นอุปกรณ์

เร็ว ๆ นี้: ตอบกลับอย่างฉลาด

Google วางแผนที่จะเพิ่ม APIs เพิ่มเติมให้กับ ML Kit ในอนาคต แต่เราทราบเกี่ยวกับ API ที่กำลังมาถึงแล้ว

ตามเว็บไซต์ ML Kit ที่กำลังจะมาถึง Smart Reply API จะช่วยให้คุณเสนอการตอบกลับการส่งข้อความตามบริบทในแอปพลิเคชันของคุณโดยการแนะนำตัวอย่างข้อความที่เหมาะสมกับบริบทปัจจุบัน จากสิ่งที่เรารู้เกี่ยวกับ API นี้แล้วดูเหมือนว่าการตอบกลับอัจฉริยะจะคล้ายกับคุณสมบัติการตอบสนองที่แนะนำที่มีอยู่แล้วในแอพ Android ของ, Wear OS และ Gmail

ภาพหน้าจอต่อไปนี้แสดงให้เห็นว่าปัจจุบันคุณลักษณะการตอบกลับที่แนะนำมีลักษณะอย่างไรใน Gmail

อะไรต่อไป? การใช้ TensorFlow Lite กับ ML Kit

ML Kit มีรุ่นที่สร้างไว้ล่วงหน้าสำหรับกรณีการใช้โทรศัพท์มือถือทั่วไป แต่ในบางจุดคุณอาจต้องการย้ายออกจากรุ่นสำเร็จรูปเหล่านี้

เป็นไปได้ที่จะสร้างโมเดล ML ของคุณเองโดยใช้ TensorFlow Lite แล้วกระจายโมเดลโดยใช้ ML Kit อย่างไรก็ตามโปรดทราบว่าไม่เหมือนกับ API สำเร็จรูปของ ML Kit การทำงานกับรุ่น ML ของคุณเองนั้นจำเป็นต้องมี สำคัญ จำนวนความเชี่ยวชาญ ML

เมื่อคุณสร้างโมเดล TensorFlow Lite แล้วคุณสามารถอัปโหลดไปยัง Firebase และ Google จะจัดการโฮสต์และให้บริการโมเดลเหล่านั้นแก่ผู้ใช้ปลายทางของคุณ ในสถานการณ์นี้ ML Kit ทำหน้าที่เป็นเลเยอร์ API เหนือโมเดลที่คุณกำหนดเองซึ่งจะทำให้การยกของหนักบางอย่างเกี่ยวข้องกับการใช้โมเดลที่กำหนดเองง่ายขึ้น ที่สะดุดตาที่สุด ML Kit จะส่งรุ่นล่าสุดของคุณไปยังผู้ใช้ของคุณโดยอัตโนมัติดังนั้นคุณจะไม่ต้องอัปเดตแอปทุกครั้งที่คุณต้องการปรับแต่งโมเดลของคุณ

เพื่อมอบประสบการณ์การใช้งานที่ดีที่สุดที่เป็นไปได้คุณสามารถระบุเงื่อนไขที่ต้องปฏิบัติตามก่อนที่แอปพลิเคชันของคุณจะดาวน์โหลดรุ่นใหม่ของรุ่น TensorFlow Lite ของคุณตัวอย่างเช่นอัปเดตโมเดลเท่านั้นเมื่ออุปกรณ์ไม่ทำงานชาร์จหรือเชื่อมต่อกับ Wi- Fi คุณสามารถใช้ ML Kit และ TensorFlow Lite ร่วมกับบริการ Firebase อื่น ๆ เช่นการใช้ Firebase Remote Config และการทดสอบ A / B Firebase เพื่อให้บริการแก่ผู้ใช้ที่แตกต่างกัน

หากคุณต้องการก้าวข้ามโมเดลที่สร้างไว้ล่วงหน้าหรือโมเดลที่มีอยู่ของ ML Kit ไม่ตรงกับความต้องการของคุณคุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับการสร้างแบบจำลองการเรียนรู้ด้วยเครื่องของคุณเองได้ที่เอกสาร Firebase อย่างเป็นทางการ

ห่อ

ในบทความนี้เราได้ดูส่วนประกอบของชุดการเรียนรู้ของเครื่องของ Google และครอบคลุมสถานการณ์ทั่วไปที่คุณอาจต้องการใช้ ML Kit API แต่ละชุด

Google วางแผนที่จะเพิ่ม API เพิ่มเติมในอนาคตดังนั้น API การเรียนรู้เครื่องใดที่คุณต้องการเห็นเพิ่มใน ML Kit ถัดไป แจ้งให้เราทราบในความคิดเห็นด้านล่าง!

Xiaomi ได้ยืนยันเมื่อต้นเดือนที่ผ่านมาว่าจะเปิดตัว Xiaomi Mi 9 Pro 5G และอุปกรณ์ Mi Mix ในสัปดาห์หน้า เรารู้แล้วมากมายเกี่ยวกับ Mi 9 Pro แต่เราเพิ่งเริ่มเรียนรู้เกี่ยวกับ Mi Mix...

Xiaomi และ amung ยืนยันเมื่อต้นปีนี้ว่าพวกเขากำลังร่วมมือกันเพื่อนำกล้อง 108MP มาร์ทโฟน ตอนนี้ดูเหมือนว่า Xiaomi Mi Mix Alpha จะบรรจุเซ็นเซอร์นี้อย่างแน่นอน...

เราแนะนำ