Nhận dạng khuôn mặt thú cưng: Chúng ta vẫn ở đó?
Công nghệ có thể nhận dạng chính xác động vật sẽ giúp chủ nhân đoàn tụ với những con vật cưng đã mất của họ, nông dân giám sát vật nuôi của họ, và các nhà nghiên cứu nghiên cứu động vật hoang dã. Có một số khả năng về vấn đề đó, với vi mạch là phương pháp nhận dạng phổ biến nhất đối với vật nuôi.
Tuy nhiên, cấy ghép chip cần phải phẫu thuật xâm lấn. Chúng không thể đọc được nếu không có thiết bị chuyên dụng và kẻ trộm có thể trích xuất các vi mạch nếu cần. Một cách tiếp cận khác là phân tích DNA, một phương pháp chính xác, nhưng cũng rất tốn kém và mất thời gian.
Nhận dạng khuôn mặt vật nuôi với phần mềm thị giác máy tính
Nhận dạng khuôn mặt vật nuôi được hỗ trợ bởi các giải pháp thị giác máy tính có thể là một giải pháp thay thế khả thi cho các phương pháp trên. Mặc dù nó có những hạn chế của nó, công nghệ này có thể chứng minh mức độ chính xác cao trong những trường hợp cụ thể.
Vì vậy, làm thế nào để nhận dạng khuôn mặt vật nuôi hoạt động? Và những thách thức cản trở sự tiến bộ của công nghệ là gì?
Nhận dạng khuôn mặt vật nuôi hoạt động như thế nào?
Nói chung, các giải pháp nhận dạng khuôn mặt vật nuôi hoạt động theo ba bước chính:
- Chụp ảnh: ảnh một con vật được chụp bằng máy ảnh có độ phân giải cao. Một số thuật toán chỉ hoạt động với các tư thế xác định trước, vì vậy cần phải chọn những hình ảnh tuân thủ các tiêu chí đó.
- Khai thác tính năng: dữ liệu sinh trắc học của động vật được đánh giá về tính phù hợp và quá trình xử lý trước được áp dụng nếu cần. Sau đó, thuật toán trích xuất tập hợp các tính năng cần thiết để nhận dạng.
- Phù hợp: các tính năng được trích xuất được biểu diễn bằng toán học và khớp với các hình ảnh khác. Ví dụ: nếu chúng tôi đang tìm kiếm một con chó trong cơ sở dữ liệu vật nuôi bị mất, chúng tôi sẽ so khớp các tính năng độc đáo của con chó với tất cả các con vật trong cơ sở dữ liệu này.
Có một số cách để thực hiện đối sánh. Một cách tiếp cận là nhóm lại sử dụng các thuật toán, chẳng hạn như KNN và DBSCAN, sẽ dẫn đến một tập hợp các hình ảnh có độ gần cao với hình ảnh mục tiêu của chúng tôi và người dùng có thể chọn hình ảnh phù hợp nhất theo cách thủ công.
Ngoài ra, các phương pháp xác suất có thể được triển khai để biểu thị kết quả cuối cùng dưới dạng mức độ tin cậy. Ví dụ, một thuật toán có thể xác định rằng hình ảnh được chụp là một con mèo với độ tin cậy là 90% và đó là một con chó với độ tin cậy là 10%.
Tín dụng hình ảnh Nơi đây
Ví dụ về nhận dạng khuôn mặt thú cưng
Dưới đây là các ví dụ về cách nhận dạng khuôn mặt vật nuôi có thể được sử dụng trong đời thực. Một số hệ thống này là giải pháp thành công, phổ biến và thậm chí là thương mại, trong khi những hệ thống khác là những nỗ lực học thuật để kiểm tra các giả thuyết.
Tìm động vật bị mất
Mất vật nuôi của họ là đau lòng cho chủ sở hữu. Và dựa trên các số liệu thống kê mệt mỏi, những trường hợp như vậy phổ biến hơn người ta có thể nghĩ. Một phần ba số chó và mèo được nuôi tại nhà ở Mỹ mất tích tại một thời điểm trong đời và 80% trong số chúng không bao giờ được tìm thấy. Có một số sáng kiến hỗ trợ nhận dạng khuôn mặt vật nuôi để giúp chủ sở hữu tìm thấy những người bạn đã mất của chúng.
ForPaws
Giải pháp nhận dạng khuôn mặt vật nuôi này xác định chó dựa trên đầu mũi, màu da và loại lông của chúng. Chủ sở hữu được yêu cầu tải lên ít nhất ba ảnh để tạo hồ sơ cho thú cưng của họ. Hiện tại, giải pháp này có thể xác định 130 giống chó với độ chính xác 90% tỷ lệ.
PiP
Công ty nhận dạng vật nuôi này đã phát triển một ứng dụng cho phép chủ sở hữu vật nuôi đăng ký và tải lên ảnh động vật của họ. Hệ thống phân tích các đặc điểm khuôn mặt độc đáo của họ. Nếu chủ sở hữu có thể cung cấp thêm thông tin, chẳng hạn như giới tính, kích thước và cân nặng, PiP tuyên bố rằng họ sẽ có thể nhận ra mọi con mèo và con chó bị lạc.
Bất kỳ người nào tìm thấy thú cưng bị thất lạc đều có thể sử dụng ứng dụng để tìm kiếm chủ nhân. Giải pháp của PiP cũng liên tục quét các phương tiện truyền thông xã hội để tìm các bài đăng về động vật và gửi cảnh báo vật nuôi bị mất tích cho cư dân của các khu vực lân cận có liên quan.
Tình yêu đã mất
Love Lost by Petco là một ứng dụng khác giúp chủ sở hữu vật nuôi và nơi trú ẩn cho động vật. Chủ sở hữu nên tạo hồ sơ động vật của họ để khi thú cưng mất tích, phần mềm có thể bắt đầu khớp thông tin sinh trắc học của thú cưng với những người mới đến trú ẩn và các động vật ứng cử viên khác.
Nhận biết một con vật cưng cụ thể
Đôi khi, việc huấn luyện một thuật toán để nhận ra một con vật cưng cụ thể cũng có ý nghĩa. Ví dụ: chủ sở hữu vật nuôi có thể được hưởng lợi từ một hệ thống xác định chính xác con vật của họ và thực hiện một hành động hậu quả, chẳng hạn như gửi cảnh báo hoặc mở cửa để cho vật nuôi vào trong. Đây là một ví dụ.
Kỹ sư Front-End, Aakaitz Garro đã phát triển Giải pháp khuôn mặt cho thú cưng
Arkaitz Garro, một kỹ sư tiền trạm của WeTransfer, đã phát triển một giải pháp nhận dạng khuôn mặt vật nuôi có thể xác định con mèo của hàng xóm và gửi cho Garro cảnh báo khi con vật ở cửa.
Để chụp ảnh con mèo, Garro đã sử dụng một chiếc máy ảnh nhỏ và một chiếc Raspberry Pi với phần mềm phát hiện chuyển động. Khi một con vật đến gần máy ảnh, hệ thống sẽ chụp ảnh và gửi nó đến nền tảng AWS Recognition, so sánh nó với các hình ảnh khác về con mèo này do Garro tải lên.
Nếu nó trùng khớp, kỹ sư sẽ nhận được thông báo.
Thiết bị IoT của Microsoft để nhận dạng vật nuôi
Tương tự như vậy, Microsoft đã phát triển một thiết bị IoT mà người dùng có thể gắn vào lối vào cho thú cưng của họ. Khi nhận ra vật nuôi, thiết bị sẽ mở cửa để vật nuôi vào trong.
Hỗ trợ các mục đích nghiên cứu – Nhận dạng khuôn mặt của cá heo
Ngoài việc xác định vật nuôi trong nhà, các thuật toán nhận dạng khuôn mặt có thể được áp dụng để phát hiện các loài khác. Có một nghiên cứu được công bố trên Tạp chí Khoa học Động vật có vú biển rằng đã điều tra tập hợp các tính năng cần thiết để nhận dạng cá heo.
Các nhà nghiên cứu có thể theo dõi và chụp ảnh 150 con cá heo mũi chai giống nhau trong khoảng thời gian 12 năm. Nhóm nghiên cứu muốn đánh giá ý tưởng sử dụng mặt và vây lưng của cá heo cho mục đích nhận dạng trong suốt cuộc đời của chúng.
Sử dụng 150 đối tượng, chỉ có 31 con cá heo có hồ sơ toàn diện (tức là các bức ảnh rõ nét từ bên trái và bên phải của khuôn mặt và vây lưng). Nghiên cứu này dựa trên ý kiến chuyên gia về con người và các phương pháp thống kê để phát hiện những điểm tương đồng giữa các hình ảnh khác nhau của cùng một con cá heo.
Kết quả của thí nghiệm này cho thấy các đặc điểm trên khuôn mặt của cá heo vẫn nhất quán theo thời gian và có thể được sử dụng cho mục đích nhận dạng. Chúng cho phép công nhận bê con sau khi trưởng thành, điều này tạo điều kiện đáng kể cho các nghiên cứu về cá heo.
Giúp nông dân giám sát vật nuôi
Xác định động vật trang trại là một quá trình đầy thử thách. Theo Zhao Jinshingười sáng lập Beijing Unitrace Tech, công ty phát triển phần mềm cho ngành nông nghiệp, “Đối với lợn thì khó hơn vì lợn nào cũng giống nhau, nhưng bò sữa thì hơi đặc biệt vì chúng có màu đen trắng và hình dáng khác nhau ”.
Bò và sự liếm của chúng
Tuy nhiên, khi nói đến bò, một thách thức khác lại nảy sinh – đó là xác định vị trí lắp đặt camera. Bò là loài động vật tò mò và sẽ nhận thấy sự thay đổi dù là nhỏ nhất của môi trường xung quanh. Họ thường cố gắng liếm máy ảnh hoặc tương tác với nó.
Bên cạnh những thách thức, việc xây dựng một hệ thống có thể nhận ra từng con bò sẽ giúp ích rất nhiều cho người nông dân. Một giải pháp như vậy có thể phù hợp với tình trạng sức khỏe của con vật và cách thức uống và ăn của nó với đặc điểm nhận dạng của con vật.
Được tăng cường với AI, nó sẽ có thể phát hiện bất kỳ dấu hiệu bệnh tật và hành vi bất thường nào và thông báo cho người nông dân trong trường hợp khẩn cấp.
Thách thức triển khai công nghệ nhận dạng khuôn mặt vật nuôi
Để hiểu tình trạng hiện tại của nhận dạng khuôn mặt vật nuôi, chúng tôi đã tham khảo ý kiến của Nhà khoa học nghiên cứu và phát triển trí tuệ nhân tạo của ITRex Group và chuyên gia thị giác máy tính, Diana Kulich.
Như Diana đã chỉ ra, nhận dạng khuôn mặt vật nuôi thua xa công nghệ nhận dạng khuôn mặt con người, vốn khá tiên tiến vào thời điểm hiện tại. Các nhà nghiên cứu đã bắt đầu thử nghiệm nhận dạng khuôn mặt vật nuôi khoảng 4 năm trước, và độ chính xác của các kỹ thuật có mục đích chung vẫn còn khá thấp. Mặt khác, các giải pháp với các mục đích cụ thể, chẳng hạn như nhận dạng một loài động vật cụ thể, có thể chính xác.
Các giải pháp thử thách chính trên khuôn mặt động vật
Theo Diana, có ba thách thức chính mà các công ty muốn triển khai các giải pháp nhận dạng khuôn mặt vật nuôi cần cân nhắc:
-
Xác định bộ tính năng tối ưu
Các nhà khoa học đã chỉ định một vector đặc trưng có thể được sử dụng để nhận dạng khuôn mặt người duy nhất. Tuy nhiên, cách tiếp cận tương tự không phù hợp với vật nuôi vì chúng ta không biết mình cần sử dụng những tính năng nào và cách diễn giải chúng.
Ví dụ: khi giao dịch với con người, các nhà khoa học có thể sử dụng kiến trúc tự động mã hóa biến thể (VAE) để trích xuất các đặc điểm từ khuôn mặt người. Theo cách tiếp cận này, ảnh của một người được nén thành vectơ có chứa các đặc điểm mong muốn, chẳng hạn như màu da và biểu cảm khuôn mặt.
Khi nói đến nhận dạng khuôn mặt vật nuôi, vẫn chưa có vector đặc trưng đáng tin cậy.
Để giải quyết thách thức của một vectơ đặc trưng đáng tin cậy sẽ nâng cao lĩnh vực này một cách đáng kể.
Một ví dụ về mã nguồn mở về vấn đề này là DogFaceNetlà một triển khai dựa trên học tập sâu để xác định loài chó.
Nó sử dụng mắt và mũi của một con chó làm đặc điểm. Giải pháp này hoạt động hợp lý nếu mục tiêu tổng thể là phân biệt các giống chó, nhưng hiệu suất của nó khá kém khi phân biệt các động vật sinh đôi.
Tùy thuộc vào Tư thế Động vật
Một ví dụ khác đang sử dụng Thuật toán Biểu đồ mô hình nhị phân cục bộ (LBPH), chuyển đổi một hình ảnh thành pixel và hoạt động bằng cách so sánh các giá trị pixel của các hình ảnh khác nhau. Phương pháp này phụ thuộc vào tư thế của con vật, điều này làm cho nó nhạy cảm với sự thay đổi tư thế. Điều đáng nói là quyết định này đã lỗi thời. Hiện tại, các kỹ sư hướng tới việc sử dụng nhiều tính năng cấp cao hơn.
-
Bắt động vật tạo dáng trước ống kính
Đối với con người, thật dễ dàng để thực hiện một tư thế cụ thể và ngồi yên. Tuy nhiên, vấn đề trở nên phức tạp hơn khi chúng ta cố gắng làm cho một con mèo hoặc một con chó bị đóng băng trong một tư thế cụ thể. Điểm này phù hợp với các thuật toán nhận dạng khuôn mặt vật nuôi nhạy cảm với tư thế, chẳng hạn như các thuật toán tùy thuộc vào độ tương đồng pixel.
-
Cung cấp bộ dữ liệu đào tạo toàn diện
Để việc đào tạo có hiệu quả, dữ liệu phải đa dạng và bao gồm tất cả các nhiệm vụ mà thuật toán dự kiến sẽ thực hiện. Ví dụ: nếu thuật toán được cho là nhận ra các giống chó khác nhau, thì tập dữ liệu phải bao gồm đầy đủ tất cả các giống được đề cập đến được chụp từ các thiên thần khác nhau và được dán nhãn thích hợp. Có một số điều có thể sai ở đây. Ví dụ: ai đó có thể gửi hình ảnh của các giống chó hỗn hợp và ai đó có thể gắn nhãn hình ảnh của họ không chính xác và gán tên giống sai. Để tránh những vấn đề như vậy, một chuyên gia phải xem xét tất cả các ảnh trong tập dữ liệu, từng ảnh một, để xác minh tính hợp pháp của ảnh và tính chính xác của nhãn.
Sự kết luận
Sự tiến bộ trong lĩnh vực nhận dạng khuôn mặt vật nuôi bị cản trở bởi thực tế là các nhà nghiên cứu vẫn chưa thể chỉ ra sự kết hợp tối ưu của các tính năng có thể được sử dụng để xác định chính xác động vật trên quy mô lớn. Tuy nhiên, có một số ứng dụng thành công hoạt động trên dữ liệu bị hạn chế, chẳng hạn như nhận dạng một loài động vật cụ thể hoặc một nhóm nhỏ động vật trong nhà hoặc động vật hoang dã.
Nếu bạn đang xây dựng hệ thống nhận dạng khuôn mặt vật nuôi của riêng mình, hãy nhớ rằng động vật là những người dùng không hợp tác sinh trắc học. Một số sẽ đòi liếm máy ảnh và những người khác sẽ từ chối tư thế chụp ảnh.
Để loại bỏ những rắc rối không cần thiết, hãy thiết kế một tư thế và thuật toán trung lập về biểu cảm. Một vấn đề khác cần xem xét là các quy định về quyền riêng tư. Nếu bạn muốn xây dựng một ứng dụng tìm vật nuôi bị thất lạc, việc yêu cầu chủ sở hữu hiển thị vị trí của chúng có phù hợp không?
Ngay cả những bức ảnh về vật nuôi trong nhà của chủ nhân của chúng cũng có thể tiết lộ nhiều hơn về người đó so với dự định.
Tín dụng hình ảnh bên trong: Do tác giả cung cấp; Cảm ơn bạn!
Hình ảnh đầu trang Tín dụng: Do Tác giả cung cấp; Cảm ơn bạn!