Các giá trị được phân tách bằng dấu phẩy (CSV) là định dạng dữ liệu được sử dụng để biểu thị dữ liệu dạng bảng, bao gồm một chuỗi các chuỗi được phân tách bằng dấu phẩy. Nó được sử dụng để lưu trữ dữ liệu dạng bảng được biểu diễn dưới dạng văn bản thuần túy ở định dạng có thể đọc được, thường để chuyển giữa các hệ thống.
Đây là một trong những dạng chính của các giá trị được phân tách bằng dấu phân cách (DSV), bên cạnh các định dạng phổ biến khác như giá trị được phân tách bằng tab (TSV) và định dạng được phân cách bằng dấu gạch ngang. Các tệp CSV được sử dụng rộng rãi để trao đổi dữ liệu qua Internet do tính linh hoạt của chúng.
CSV là loại tệp văn bản thuần túy, nghĩa là việc sắp xếp, phông chữ và giá trị nhị phân đều không quan trọng. Tệp CSV bao gồm số lượng bản ghi bất kỳ, được phân tách bằng dấu ngắt dòng và mỗi bản ghi là một chuỗi trường, được phân tách bằng dấu phẩy. Các trường không được đính kèm có thể chứa các ký tự dấu phẩy và dòng mới, có thể được giải thích bằng cách sử dụng các ký tự trích dẫn.
Những tệp này cực kỳ hữu ích trong việc truyền dữ liệu giữa các hệ thống và được sử dụng trong phân tích, thao tác và trình bày dữ liệu. Ví dụ: chúng có thể được sử dụng để chuyển dữ liệu từ cơ sở dữ liệu quan hệ sang các chương trình bảng tính như Microsoft Excel. Chúng cũng thường được sử dụng để nhập và xuất số lượng lớn giữa các cơ sở dữ liệu và ứng dụng lớn.
Do tính phổ biến và linh hoạt, các tệp CSV được sử dụng để lưu trữ nhiều loại dữ liệu khác nhau. Các trường có thể chứa văn bản, số, giá trị Boolean hoặc ngày/giờ. Mặc dù các ứng dụng có thể cung cấp các tùy chọn để kiểm soát một số định dạng CSV nhưng không có thông số kỹ thuật nghiêm ngặt nào quy định cách lưu trữ dữ liệu.