Nhóm sinh viên ngành Kỹ thuật phần mềm Đại học FPT gồm Lê Anh Nam, Nguyễn Xuân Trường, Lê Trần Hoàn, Nguyễn Xuân Tỉnh đã thực hiện đồ án tốt nghiệp về xử lý Big Data “Research Platforms and Algorithms for Big Data Analytics”. Đề tài xây dựng hệ thống với tên gọi "Facebook mining" trên nền tảng xử lý và phân tích người dùng Facebook qua thông tin họ công khai.
Ý tưởng đến từ việc nhóm sinh viên nhận thấy trong kỷ nguyên Big Data, các quyết định được đưa ra không dựa vào chuyên gia mà từ tập hợp dữ liệu lớn. Lượng dữ liệu khổng lồ doanh nghiệp thu thập trong lúc khách hàng ghé thăm và tương tác với trang web, mạng xã hội của mình sẽ chỉ ra thông tin về thói quen, sở thích của khách hàng.
Thế giới có vài sản phẩm với chức năng tương tự như VFP Pro, Facebook ID Scraper, Facebook Ninja, hay Mass Spider. Việt Nam có hệ thống Simple UID. Tuy nhiên, Simple UID chỉ cho phép lọc được danh sách bạn bè của một người bất kỳ công khai danh sách; người thích, bình luận một bài đăng bất kỳ; thành viên của một nhóm hoặc người tham gia sự kiện bất kỳ.
Mỗi lần, từ một ID của người dùng Facebook, Simple UID chỉ lấy được thông tin ID bạn bè của người dùng đó, hoặc từ một Fanpage nhất định chỉ lấy được thông tin ID của người thích trang đó.
"Facebook mining" cho phép khai thác và phân tích dữ liệu rộng hơn. Từ một ID của người dùng Facebook, hệ thống lấy được ID bạn bè của người dùng đó, thậm chí ID bạn của bạn bè người dùng đó theo cách không giới hạn.
Hệ thống này thu thập tự động tập ID của tất cả người dùng Facebook, sau đó là dữ liệu cá nhân và bài đăng của họ để phân tích xu hướng người dùng về một chủ đề cụ thể, đánh giá độ tin cậy của người dùng.
Nếu được ứng dụng trong thực tế, "Facebook mining" sẽ giúp doanh nghiệp nhanh chóng tìm được tập khách hàng chất lượng để tiến hành các chương trình quảng cáo hiệu quả. Danh sách tìm ra phần lớn là khách hàng thật, thực sự có nhu cầu với sản phẩm, dịch vụ mà doanh nghiệp có thể tiếp cận.
Nhóm sinh viên thực hiện đồ án cùng thầy hướng dẫn - Tiến sĩ Phan Duy Hùng (thứ hai từ phải sang). |
Bước đầu, "Facebook mining" phân tích và xử lý thông tin trong lĩnh vực bất động sản. "Facebook mining" tổng hợp và phân tích hành vi người dùng trên nhiều chiều nhằm tìm kiếm khách hàng tiềm năng về các giao dịch bất động sản (mua/ bán/ thuê nhà, đất, chung cư).
Kết quả xử lý dữ liệu từ hệ thống “Facebook mining” của nhóm sinh viên đã đưa ra được danh sách khách hàng có nhu cầu mua nhà với độ tin cậy cao. Nhóm dự định phát triển ứng dụng hệ thống "Facebook mining" ở nhiều chủ đề, phân tích theo nhiều xu hướng: kinh doanh, giáo dục, y tế…
Với những tính năng được cập nhật trong tương lai, họ kỳ vọng "Facebook mining" sẽ giúp các tổ chức, doanh nghiệp cắt giảm chi phí, thời gian, phát triển và tối ưu hóa sản phẩm, dịch vụ.
“Khó khăn lớn nhất của nhóm là thiếu kinh nghiệm, kiến thức về Big Data còn khá mới mẻ. Nhờ thầy hướng dẫn Phan Duy Hùng nhiệt tình hướng dẫn, nhóm đã có cái nhìn tổng quan và hình dung được cách thực hiện đồ án”, bạn Lê Anh Nam - trưởng nhóm đồ án bày tỏ.
Tác giả: Hương Hoàng
Nguồn tin: Báo VnExpress