CSV / TSV sang Markdown Table Online
Convert file CSV hoặc TSV sang bảng Markdown chuẩn GitHub. Tự động phát hiện dấu phân cách, hỗ trợ encoding UTF-8 cho tiếng Việt có dấu.
Lợi ích
Tự động nhận dấu phân cách: dấu phẩy (,), tab, dấu chấm phẩy (;), dấu pipe (|). Không cần chỉ định thủ công.
UTF-8 với BOM/không BOM. CSV xuất từ Excel tiếng Việt với dấu chấm phẩy (do Excel VN default) đều xử lý được.
PapaParse parse 100k hàng dưới 1 giây. Output Markdown table render ngay trong textarea.
Cách dùng
- 1Drop file .csv/.tsv hoặc paste nội dung trực tiếp vào ô input.
- 2Auto-detect delimiter và header row.
- 3GFM table xuất hiện với alignment chuẩn.
- 4Copy hoặc tải .md, hoặc 'Open in ChatGPT' để phân tích data.
CSV to Markdown table là gì?
CSV (Comma-Separated Values) là format text plain phổ biến nhất cho dataset — Excel, Google Sheets, database export đều hỗ trợ. Khi feed CSV thẳng vào ChatGPT/Claude, AI hiểu được nhưng cấu trúc thường đọc khó khi data nhiều cột; chuyển sang GFM table giúp AI 'thấy' bảng rõ ràng và trả lời chính xác hơn.
Engine dùng PapaParse — thư viện CSV JavaScript phổ biến nhất, hỗ trợ streaming với file lớn, escape quote/newline trong cell, encoding detection. Output là 2D array, chúng tôi format sang GFM với hàng đầu làm header.
Phù hợp cho: data analyst convert dataset Kaggle/government open data sang MD; nhân viên kinh doanh convert export từ CRM (HubSpot, Salesforce) sang format AI; dev paste CSV nhỏ vào AI để xin code phân tích.
- ✓Hỗ trợ delimiter: comma, semicolon, tab, pipe, custom
- ✓Quote escape: "value with, comma" được parse đúng
- ✓Newline trong cell (multi-line value) hỗ trợ
- ✓Header row auto-detect (có thể tắt nếu data không có header)
- ✓Alignment columns: left/center/right (mặc định left)
- ✓UTF-8 / UTF-8 BOM / Windows-1252 detection
Khi nào cần dùng?
Dataset nhỏ trên Kaggle (CSV) → convert sang MD → paste Claude/ChatGPT để xin EDA hoặc gợi ý feature engineering.
Export CSV từ HubSpot, Notion DB, Airtable → convert MD → AI viết summary report.
Bank export CSV → MD → Claude phân tích chi tiêu theo category.
Google Forms export CSV → MD → AI tổng hợp comment, tìm theme.
SQL query export CSV → MD → AI giải thích pattern hoặc viết visualization code.
Công nghệ đằng sau
PapaParse là thư viện CSV mạnh nhất trong hệ sinh thái JS, 12k+ stars GitHub, dùng bởi Mozilla, NASA, Tableau. Hỗ trợ streaming (parse từng chunk) cho file rất lớn, header detection thông minh, type inference (string/number/date), và performance cực tốt nhờ web worker.
Auto-detect delimiter dùng heuristic: count occurrence của các candidate (`,`, `;`, `\t`, `|`) trên 5 dòng đầu, chọn cái xuất hiện nhiều nhất và đều nhau. Algorithm này đúng 99% với data thật từ Excel/Google Sheets/database export.
Output GFM table có alignment row chuẩn `|---|---|---|`. Với cell chứa pipe `|` (kỹ tự đặc biệt của MD table), chúng tôi escape thành `\|` để không phá cấu trúc. Cell chứa newline được join lại bằng `<br/>` HTML — Claude/ChatGPT hiểu được.
Câu hỏi về CSV → Markdown
File rất lớn (1M+ hàng) có dùng được không?
Browser sẽ chậm với file >100MB. Phase 2 sẽ có streaming mode. Hiện tại nên cắt file thành chunk hoặc dùng SQL/pandas để pre-aggregate trước.
TSV (tab-separated) có hỗ trợ không?
Có. Auto-detect tab delimiter. Bạn cũng có thể đổi tên file sang .tsv để chỉ định rõ format.
CSV xuất từ Excel tiếng Việt dùng dấu chấm phẩy, có vấn đề không?
Không vấn đề. Auto-detect nhận ra dấu chấm phẩy. Cũng hỗ trợ tiếng Việt có dấu UTF-8 đầy đủ.
Empty cells thế nào trong MD table?
Cell rỗng giữ nguyên — render như cell trống. Bạn có thể dùng option 'Replace empty with -' để dễ nhìn hơn.
Có giữ được kiểu dữ liệu (số, ngày) không?
GFM table chỉ là string. Format gốc của number/date được giữ nguyên dạng text. AI nhận biết được số trong table và tính toán bình thường.