Xem xét dùng trí tuệ nhân tạo kiểm soát rủi ro trên dữ liệu hóa đơn điện tử

Theo nguồn tin từ Tổng cục Thuế (Bộ Tài chính), Ban Quản lý rủi ro (QLRR) của Tổng cục Thuế dự kiến đưa công nghệ trí tuệ nhân tạo (AI-Artificial intelligence) vào tăng cường kiểm soát và phân tích rủi ro trên dữ liệu hóa đơn điện tử (HĐĐT).

Phân tích rủi ro trên dữ liệu hóa đơn điện tử bằng AI

Theo quy định của Luật Quản lý thuế số 38/2019/QH14, Nghị định 123/2020/NĐ-CP, các cơ sở kinh doanh (CSKD) sẽ phải sử dụng HĐĐT theo định dạng của cơ quan thuế. Đối với HĐĐT có mã, cơ quan thuế có ngay dữ liệu khi hóa đơn được cấp mã, đối với HĐĐT không có mã của cơ quan thuế thì cơ sở kinh doanh phải gửi dữ liệu hóa đơn cho cơ quan thuế. Trường hợp CSKD sử dụng hóa đơn giấy thì cũng phải gửi dữ liệu hóa đơn giấy cho cơ quan thuế.

Với sự phát triển của các giao dịch kinh doanh thì hàng năm hệ thống sẽ tiếp nhận khoảng 10 tỷ HĐĐT - đây là nguồn dữ liệu lớn (big data) vì vậy để phân tích, xử lý dữ liệu hóa đơn thì việc sử dụng AI là xu thế tất yếu.

Sử dụng AI vào phân tích, xử lý dữ liệu hóa đơn là xu thế tất yếu

Thực tế, sau 1 tháng (21/11/2021-21/12/2021) triển khai áp dụng HĐĐT giai đoạn 1 tại 6 tỉnh (Hà Nội, TP Hồ Chí Minh, Hải Phòng, Quảng Ninh, Bình Định, Phú Thọ) theo Quyết định số 117/QĐ-TCT, số lượng người nộp thuế (NNT) đã đăng ký sử dụng HĐĐT theo Nghị định 123 là 270.157 chiếm 73,1% tổng số NNT của 6 tỉnh.

Là đơn vị được phân công chủ trì quản lý dữ liệu, kiểm soát và phân tích rủi ro trên dữ liệu HĐĐT, Ban QLRR đã nghiên cứu phương pháp phân tích dữ liệu lớn theo các mô hình thống kê, phân tích rủi ro bằng công nghệ AI.

Theo đó, để áp dụng công nghệ AI trong phân tích dữ liệu lớn, dữ liệu HĐĐT sẽ được phân tích cùng với các dữ liệu về thuế khác như dữ liệu quản lý thuế của cơ quan thuế và dữ liệu thu thập từ các cơ quan ngoài.

Dữ liệu HĐĐT tập trung về CSDL phân tích sẽ lựa chọn tối giản thông tin để tránh việc lặp lại dữ liệu không cần thiết ở CSDL gốc và CSDL phân tích. Những thông tin về tờ khai đăng ký/thay đổi thông tin sử dụng HĐĐT, những thông báo giữa các tổ chức/cá nhân/hệ thống không tập trung đầy đủ về CSDL phân tích. Khi cần thiết có thể truy vấn trực tiếp từ CSDL tác nghiệp HĐĐT.

Ban QLRR cho biết, AI sẽ hỗ trợ phát hiện những khác biệt về việc sử dụng hóa đơn trong khối lượng lớn hóa đơn của các doanh nghiệp thuộc các lĩnh vực sản xuất, kinh doanh khác nhau. Kết hợp với kết quả thực tế của các cuộc thanh tra, kiểm tra hóa đơn làm dữ liệu học trong phương pháp học máy sẽ giúp xác định các chỉ số tiêu chí quan trọng trong đánh giá rủi ro trong sử hóa đơn của NNT. Từ đó, xây dựng được bộ chỉ số tiêu chí khách quan và sát với thực tế hơn.

Lộ trình 2 giai đoạn

Cũng theo Ban QLRR, tiến tới xây dựng mô hình dự báo theo AI, Tổng cục Thuế sẽ áp dụng các thuật toán học máy phát hiện những trường hợp rủi ro gian lận khi sử dụng hóa đơn, xác định các trường hợp bất thường về mặt hàng và doanh thu với tài sản cố định, kho hàng (ví dụ xuất khẩu tinh bột sắn với doanh thu rất lớn và không có kho lưu hàng hóa); áp dụng kỹ thuật xác xuất dạng đồ thị để phát hiện xâu chuỗi nghi ngờ buôn bán hóa đơn. Từ đó có biện pháp cảnh báo, ngăn chặn.

Bài toán phân nhóm, tìm khác biệt và thiết lập mô hình dự báo bằng công nghệ AI có thể áp dụng với nhiều dạng phân tích trên dữ liệu HĐĐT và dữ liệu trên các hồ sơ khai thuế. Ngoài ra, các mô hình xác suất đồ thị phát hiện tương quan giữa các đối tượng có thể giúp phát hiện các doanh nghiệp liên quan trong chuỗi luân chuyển hóa đơn. Đó là những công nghệ cần thử nghiệm sớm để tăng cường kiểm soát và phát hiện rủi ro trong sử dụng HĐĐT.

Tổng cục Thuế dự kiến đưa AI vào tăng cường kiểm soát HĐĐT theo 2 giai đoạn trong năm 2022

Cùng với các giải pháp kỹ thuật, Tổng cục Thuế cần tiếp tục hoàn thiện hơn nữa hệ thống HĐĐT, đảm bảo thông tin dữ liệu chính xác, minh bạch an toàn đáp ứng nhu cầu quản lý và tạo điều kiện cho người nộp thuế. Hướng đến phục vụ công tác thanh tra, kiểm tra bằng điện tử, bảo đảm ngày càng công khai, minh bạch, hiệu quả, tiết kiệm và đúng pháp luật.

Ban QLRR đã đề xuất lộ trình, kiến nghị thực hiện năm 2022 theo hướng đưa AI vào tăng cường kiểm soát và phân tích rủi ro trên dữ liệu HĐĐT thông qua 2 giai đoạn.

Giai đoạn 1 từ tháng 1/2022 đến 6/2022: Tập trung kiểm soát chất lượng HĐĐT và thực hiện các biện pháp đối chiếu phát hiện sai sót/gian lận. Thử nghiệm các mô hình phân tích nâng cao.

Trên hệ thống tác nghiệp HĐĐT, AI thực hiện các kiểm tra hóa đơn sai sót, các trường hợp sử dụng hóa đơn không đúng quy định, sử dụng hóa đơn bất hợp pháp; thực hiện các kiểm tra thông tin trên HĐĐT với thông tin kê khai, thông tin từ các cơ quan ngoài; phát triển tính năng xác minh hóa đơn.

Đồng thời, thiết lập CSDL phân tích rủi ro với dữ liệu quản lý thuế, thu thập từ bên thứ ba và thông tin HĐĐT. Thực hiện các đối chiếu đa chiều, phát hiện rủi ro.

Giai đoạn 2 từ tháng 7/2022: Triển khai áp dụng các mô hình phân tích nâng cao, tăng cường quản lý hiệu quả HĐĐT thông qua AI. Qua đó, mở rộng đối chiếu, so sánh với dữ liệu thu thập từ các bên thứ ba.

Cùng với đó, lập đề án triển khai, từng bước đưa các mô hình phân tích nâng cao vào áp dụng phát hiện rủi ro nâng khống giá trị hàng hóa, xác định chuỗi luân chuyển hóa đơn; đưa ra các trường hợp nghi ngờ gian lận hoàn thuế, gian lận hóa đơn cần ngăn chặn; phát hiện các trường hợp rủi ro cao cần kiểm tra, thanh tra.