Thuật toán thần thánh!

Dành một chút thời gian cho anh em nào đam mê #DeepLearning hay #DataMining nhỉ.

Cosine Similarity dùng để tìm độ tương đồng giữa hai vector và thật may mắn là chúng ta đều có thể quy đổi mọi thứ thành vector N chiều (ôi đau đầu quá). Vì thế chúng ta có thể sử dụng Cosine Similarity để loại bỏ các dữ liệu giống nhau cho giai đoạn tiền xử lý dữ liệu trước khi #DeepLearning, hoặc tìm ra các dữ liệu giống nhau để làm gì đấy với #DataMining (ví dụ để tìm ra các khách hàng có hành vi giống nhau chẳng hạn)

Cosine Similarity mặc dù rất đơn giản nhưng lại có vai trò rất quan trọng trong nhiều lĩnh vực. Mình đã từng làm #elasticsearch plugin cho 1 khác hàng Nhật Bản, nó thực sự đáng để lưu tâm.

Code tham khảo nhé mọi người: Cosine Similarity