Độc lạ Phần Lan: Tù nhân tham gia vào huấn luyện AI (trí tuệ nhân tạo)

Trong bối cảnh thiếu lực lượng lao động và mức lương chi trả cao, một công ty công nghệ Phần Lan đã tìm ra nguồn nhân lực mới: tù nhân. Những người này sẽ làm công việc clickworker nhằm huấn luyện thuật toán AI. Cùng Techie đưa ra góc nhìn về vấn đề này nhé!

Hình thức cải tạo tù nhân mới

Trong một căn phòng không có cửa sổ, người phụ nữ 40 tuổi có biệt danh là Marmalade đang tham gia vào chương trình cải tạo tù nhân đặc biệt. Chiếc bàn nơi cô ngồi trống trơn, chỉ có một chai nước nhỏ và một chiếc máy tính xách tay HP. Liên tục trong suốt 3 giờ, máy tính đã được lập trình để hiển thị cho Marmalade các đoạn văn bản ngắn về bất động sản và sau đó đặt câu hỏi có hai lựa chọn “có” hoặc “không” về những gì cô ấy vừa đọc. Một câu hỏi: “đoạn văn vừa rồi cập đến một quyết định về bất động sản, chứ không phải là một ứng dụng phải không?”. “Có chút chán” – Marmalade nhún vai khi mô tả về công việc của mình.

Công việc gán nhãn dữ liệu
Công việc gán nhãn dữ liệu thường khá nhàm chán

Thực chất, Marmalade đang đào tạo một mô hình ngôn ngữ lớn (Large Language Model) được phát triển bởi công ty start-up Metroc tại Phần Lan. Mức lương cho công việc gán nhãn dữ liệu này là 1,54 Euro/giờ.

Metroc đang xây dựng một công cụ tìm kiếm nhằm giúp các công ty xây dựng tìm được các dự án mới đã được phê duyệt. Để làm được điều này, Metroc cần những người gắn nhãn dữ liệu nhằm giúp mô hình của họ hiểu được thông tin từ các bài báo và tài liệu về các dự án đô thị.

Công việc “click chuột” từ trong tù

“Clickworker” – gọi nôm na là “nhân viên nhấp chuột” là công việc online khá phổ biến tại các nước có thu nhập thấp. Các công ty công nghệ cần clickworkers để hoàn thiện các sản phẩm trí tuệ nhân tạo. Vì phần lớn các công việc như phiên dịch từ ngữ hay lựa chọn hình ảnh không thể thực hiện hoàn toàn bởi robot.

Ví dụ đơn cử như OpenAI đã thuê nhân sự ở các nước Kenya, Uganda và Ấn Độ để làm clickworkers. Hay như Đông Nam Á cũng là nơi có nhiều người làm công việc này. Tuy nhiên, phần lớn các mô hình đào tạo AI đều đến từ các công ty Hoa Kỳ với ngôn ngữ phổ biến là tiếng Anh. Còn tiếng Phần Lan lại là ngôn ngữ rất hiếm được sử dụng ở Ấn Độ hay Đông Nam Á.

Nhà tù Hämeenlinna
Nhà tù Hämeenlinna – nơi có tù nhân đang làm lao động dữ liệu

Đó là lý do tại sao Metroc đã quyết định sử dụng lao động tù. Công ty có được những người làm việc nói tiếng Phần Lan với giá rẻ, và hệ thống nhà tù có thể cung cấp thêm cơ hội việc làm cho tù nhân, góp phần giúp họ tham gia vào công việc lao động số sau khi ra tù.

Vốn dĩ, việc các công ty công nghệ sử dụng lao động dữ liệu với đồng lương rẻ mạt và để họ phải tiếp xúc với những nội dung độc hại thường gây ra sự chỉ trích. Nhưng dự án thuê tù nhân tại Phần Lan lại nhận được sự ủng hộ rộng rãi. Bởi, dù Phần Lan có thể nổi tiếng với những “nhà tù mở” – nơi tù nhân có thể tham gia làm việc hoặc học tập ở các khu vực lân cận – nhưng nhà tù đang hợp tác với Metroc không thuộc trong nhóm đó. Đây là nơi có cơ sở an ninh cao nhất cả nước. Vì thế, 3 giờ làm việc trên máy tính mỗi ngày cũng sẽ giúp các tù nhân có cảm giác “thành tựu” hơn. “Dù không có gì nhiều, nhưng cũng tốt hơn là ở trong phòng tù,” Marmalade nói.

Ngoài Hämeenlinna – nhà tù nơi Marmalade – còn có 2 nhà tù khác cho phép các tù nhân làm công việc lao động dữ liệu. Tù nhân được trả lương theo giờ, không phải theo tốc độ hoặc chất lượng công việc của họ.

Góc nhìn trái chiều

Amos Toh – nhà nghiên cứu cấp cao về công nghệ AI tại Tổ chức Nhân quyền Quốc tế thể hiện sự hoài nghi về dự án: “Có nhiều cách mà một người trong tù có thể phát triển bản thân, ví dụ như tham gia vào các chương trình giao dục. Nhưng tôi hoài nghi việc gán nhãn dữ liệu cho một công ty với mức lương hơn 1 Eur/giờ liệu có ý nghĩa phát triển gì hay không?”

Với Toh, việc tăng cường tìm kiếm những người làm công việc clickworker đã tạo ra một xu hướng, trong đó các công ty ngày càng chuyển hướng đến các nhóm người khó có cơ hội khác: người tị nạn, những người ở trong các quốc gia đang trải qua khủng hoảng kinh tế – và bây giờ là tù nhân.

Mặt khác, mức độ mà việc gán nhãn dữ liệu mang lại cho tù nhân kỹ năng có thể chuyển giao cho công việc sau khi ra khỏi tù là không rõ ràng. Ngoài ra, một số người cũng lo ngại về việc các tù nhân sẽ có khả năng tiếp xúc với những dữ liệu có nội dung độc hại như bạo lực, tình dục – từ đó có thể gây ra các tác động tiêu cực.

>>Xem thêm: Tại sao Bullet Journal có thể trở nên toxic?

Khám phá thêm
Mối quan hệ tình yêu luôn là một chủ đề hấp dẫn và phức tạp. Cũng dễ hiểu khi nhiều...
“Chúng ta đang sống trong thế giới VUCA” – Câu nói này đã diễn tả đúng tình trạng thế giới...
Trong bài viết này, Techie sẽ giới thiệu đến bạn bản chất của tính năng constraints và auto-layout figma, cũng...
Temu, một ứng dụng mua sắm Trung Quốc, đang gây chấn động trên internet với những sản phẩm rất rẻ....
Theo một “nguồn tin mật” cho hay, Ghibli chính thức công bố trailer phần tiếp theo của tựa phim Vùng...
Cảm biến sinh học (Biosensor) đã đánh dấu một thành tựu quan trọng trong cuộc chiến chống đại dịch COVID-19 khi...
Thuật toán Dijkstra là một công cụ quan trọng trong lý thuyết đồ thị và tối ưu hóa. Với khả...
Với tỷ lệ dân số sử dụng Internet chiếm đến hơn 70%, Việt Nam luôn được coi là thị trường...