เนื้อหา
อัปเดต, 12 กรกฎาคม 2019 (7:15 น. ET): เมื่อต้นสัปดาห์ผู้ประกาศข่าวชาวเบลเยี่ยม VRT NWS ยกระดับการปฏิบัติเกี่ยวกับการถอดเสียงที่ Google โดยเน้นถึงความเป็นส่วนตัวที่เกี่ยวข้องกับการมีส่วนร่วมของผู้รับเหมา ในโพสต์บล็อกที่เผยแพร่เมื่อวานนี้ Google ได้ตอบข้อวิจารณ์
Google ได้ปกป้องวิธีการถอดเสียงโดยระบุว่าผู้เชี่ยวชาญด้านภาษาที่ใช้นั้นมีความสำคัญต่อการพัฒนาผลิตภัณฑ์ Google ย้ำว่าผู้รับเหมาทำงานเฉพาะกับคลิปเสียงที่ไม่ระบุชื่อจำนวนเล็กน้อยและกล่าวว่ามันใช้“ การป้องกันที่หลากหลายเพื่อปกป้องความเป็นส่วนตัวของผู้ใช้” ในระหว่างกระบวนการ
เกี่ยวกับบทสนทนาที่อาจถูกส่งไปยัง Google โดยไม่ตั้งใจ Google กล่าวว่า: "ผู้ตรวจสอบมีคำสั่งไม่ให้คัดลอกบทสนทนาเบื้องหลังหรือเสียงอื่น ๆ และเพื่อคัดลอกตัวอย่างข้อมูลที่มุ่งสู่ Google เท่านั้น"
บริษัท ยอมรับว่ามี“ การยอมรับผิด” เกิดขึ้นซึ่งอุปกรณ์จะตีความวลี OK ที่ร้อนแรงของ Google และเริ่มการบันทึก อย่างไรก็ตาม Google กล่าวว่ามี“ การป้องกันจำนวนหนึ่ง” เพื่อป้องกันไม่ให้เกิดเหตุการณ์เช่นนี้และมันจะเกิดขึ้น“ น้อยมาก”
น่าเสียดายที่ Google ไม่ได้อธิบายถึงการคุ้มครองเหล่านี้ในรายละเอียดใด ๆ นอกจากนี้การยอมรับผิดเหล่านี้เกิดขึ้นในการบันทึก 135 จาก 1,000 ครั้ง VRT NWS ตรวจสอบแล้วซึ่งหมายความว่าอาจเกิดขึ้นประมาณ 10 เปอร์เซ็นต์ของเวลา
ในที่สุด Google กล่าวว่ามันกำลังตรวจสอบการรั่วไหลของข้อมูลล่าสุด VRT NWSซึ่งละเมิดนโยบายของตนและจะดำเนินการเพื่อหยุดการรั่วไหลของสิ่งเหล่านี้ในอนาคต
ในโพสต์บล็อกของตน Google ไม่ได้หารือเกี่ยวกับการขาดข้อมูลในนโยบายความเป็นส่วนตัวของตนเกี่ยวกับการมีส่วนร่วมของมนุษย์ในกระบวนการถอดความเสียง
มีเหตุผลที่ผู้เชี่ยวชาญด้านภาษาจะต้องทำงานเกี่ยวกับผลิตภัณฑ์ที่เกี่ยวกับภาษาดังนั้นฉันสงสัยว่าผู้ปฏิบัติงานมนุษย์จะมาอยู่ที่นี่ในตอนนี้ หากคุณไม่เห็นด้วยกับสิ่งนั้นอาจถึงเวลาที่จะทิ้งอุปกรณ์ที่เชื่อมต่อของคุณ
ความคุ้มครองดั้งเดิม, 11 กรกฎาคม 2019, 11:05 น. ET: ผู้ประกาศข่าวชาวเบลเยียมแสดงให้เห็นถึงสิ่งที่เกิดขึ้นหลังประตูปิดของงานถอดรหัสเสียงผู้ช่วยของ Google (ผ่าน The Verge) ผู้ประกาศ VRT NWSพูดกับแหล่งข่าวที่ไม่ระบุชื่อสามแหล่งและฟังการบันทึกมากกว่า 1,000 รายการขณะตรวจสอบกระบวนการถอดความ
VRT NWS เรียนรู้ว่า Google จ้างผู้รับเหมาคนเพื่อถอดเสียงเพื่อปรับปรุงบริการ อย่างไรก็ตามสิ่งเหล่านี้มักจะรวมถึงรายละเอียดส่วนตัวที่สามารถระบุตัวบุคคลได้ VRT NWS กล่าวว่าสามารถติดต่อบางคนได้จากข้อมูลที่ละเอียดอ่อนเช่นที่อยู่รวมอยู่ในการบันทึก
นอกจากนี้ผู้แพร่ภาพกระจายเสียงพบว่า 153 ตัวอย่างที่ฟังดูเหมือนจะได้รับการบันทึกโดยที่ผู้ใช้ไม่ได้ให้ข้อความร้อน“ OK, Google” อย่างชัดเจน
บางครั้งการบันทึกเหล่านี้รวมถึงการสนทนาที่ละเอียดอ่อนที่บันทึกความรักเด็กสุขภาพเงิน ฯลฯ หนึ่งในนั้น VRT NWS แหล่งข่าวกล่าวว่าพวกเขาได้ยินเสียงบันทึกซึ่งรวมถึงเสียงของผู้หญิงในความทุกข์ที่เห็นได้ชัด
คุณสามารถดูรายงานวิดีโอในเรื่องด้านล่าง แต่คุณจะต้องเปิดใช้งานคำอธิบายภาพสำหรับการแปลภาษาอังกฤษ
เราไม่รู้เรื่องนี้หรือ
Google มีความโปร่งใสพอสมควรเกี่ยวกับข้อมูลที่รวบรวมจากผู้ใช้และเรารู้อยู่แล้วว่ามันบันทึกการบันทึกเสียงของเราคุณสามารถเดินทางไปที่นี่เพื่อรับฟังบันทึกส่วนตัวของคุณได้หากคุณเคยใช้ Google Assistant (เคยใช้งานมาก่อน) กิจกรรมเสียงและเสียง).
ยิ่งไปกว่านั้นเมื่อเร็ว ๆ นี้พบว่าพนักงานของ Amazon ฟังการบันทึกของ Alexa ในแบบเดียวกับ Google
อย่างไรก็ตาม Google ไม่ชัดเจนเกี่ยวกับผู้รับเหมามนุษย์ที่ฟังการบันทึกหรือเกิดอะไรขึ้นเมื่อผลิตภัณฑ์ Google คิดว่าได้ยินคำว่า "OK Google" หรือ "Hey Google" เมื่อไม่ได้ใช้งานอย่างชัดเจน
ในหน้าการรวบรวมข้อมูลของ Google ที่ลิงก์ด้านบนไม่มีการกล่าวถึงปัจจัยเหล่านี้
ทำไมมนุษย์ถึงฟังอยู่?
บริษัท เช่น Google และ Amazon พึ่งพาผู้ฟังมนุษย์เพื่อถอดความข้อความเพื่อปรับปรุงสิ่งต่าง ๆ เช่นอัลกอริทึมการรู้จำเสียงหรือประสบการณ์ของลูกค้า
บริษัท อ้างว่ามีตัวอย่างเพียงเล็กน้อยเท่านั้นที่ใช้สำหรับกระบวนการนี้อย่างไรก็ตามตัวอย่างเหล่านั้นไม่ได้ถูกส่งไปยังผู้รับเหมาพร้อมกับระบุข้อมูล ไม่มีชื่อหรือข้อมูลตำแหน่งที่แนบมากับไฟล์เพียงเสียง
แต่สิ่งนี้ไม่ได้ยกเว้นความเป็นไปได้ที่คนที่พูดจะเปิดเผยข้อมูลที่ละเอียดอ่อนระหว่างการบันทึก - บางสิ่งที่เป็นปัญหาโดยเฉพาะอย่างยิ่งในกรณีที่การบันทึกเกิดขึ้นโดยไม่ตั้งใจ
โฆษกของ Google กล่าวว่า บริษัท ใช้ผู้เชี่ยวชาญด้านภาษาทั่วโลกเพื่อคัดลอก“ ประมาณ 0.2 เปอร์เซ็นต์” ของการแถลงข่าว บริษัท ภายหลังโพสต์รายการบล็อกซึ่งแสดงให้เห็นถึงนโยบายนี้เพิ่มเติม
โฆษกยังกล่าวอีกว่า Google จะตรวจสอบว่าจะทำให้นโยบายชัดเจนขึ้นอย่างไรเกี่ยวกับวิธีการใช้ข้อมูลผู้ใช้เพื่อปรับปรุงเทคโนโลยีการพูด ในรายงานวิดีโอข้างต้น Google ได้รับการเสนอราคาด้วยว่าการทำงานประเภทนี้เป็นสิ่งสำคัญในการจัดหาผลิตภัณฑ์เช่น Google Assistant
ไม่ว่า Google จะขายผลิตภัณฑ์หลักและโทรศัพท์ Android หลายพันล้านเครื่องก็ตาม ตัวเลข 0.2% ที่ยกมายังคงหมายถึงการบันทึกของเราหลายล้านครั้ง - อาจถูกบันทึกโดยอุบัติเหตุอาจรวมถึงข้อมูลส่วนตัวของเรา - ถูกรับฟังโดยผู้ประกอบการมนุษย์
ฉันจำไว้ว่าหากคุณเป็นเจ้าของหรือตั้งใจจะซื้ออุปกรณ์ที่เปิดใช้งานผู้ช่วยดังกล่าว อาจใช้สวิตช์ "ปิดไมโครโฟน" เป็นครั้งคราวเช่นกัน
อ่านต่อไป: หน้าแรกของ Google Hub กับ Amazon Echo Show 2: Battle of the smart display