CSVのIDを使ったハッシュ

翻訳プロジェクトなどをみていて必要だったプログラム

#!/usr/bin/perl -w

# argv[0] で指定したファイル（内容：ID,置き換え前文字列<LF>の羅列）を、
# argv[1]のファイル（内容：ID,置き換え後文字列<LF>の羅列）を使った IDをキーにして新たに書きだすプログラム
# CRLFやカンマ、ダブルクオートのエスケープも行う。
# 文字エンコーディングはutf8に指定。

# 参考 http://codezine.jp/article/detail/1020
# 参考 http://hole.sugutsukaeru.jp/archives/13/2
# 参考 http://www.din.or.jp/~ohzaki/perl.htm#CSVwithCRLF

my %csvdata = ();

use strict 'refs';
use lib '..';
use utf8;
use Encode;

#カンマや改行を含むフィールドをクオートする関数　http://hole.sugutsukaeru.jp/archives/13/2
sub escape4txt{
	my $str = shift;
	defined $str or return '';
	return $str unless ($str =~ /[,"\r\n\t]/);
	$str =~ s/"/""/g;
	$str =~ s/\r\n/\n/g;
	return "\"$str\"";
}


binmode STDOUT, ":utf8";

open DATA, "<:utf8", $ARGV[1];

# 値に改行コードを含む CSV形式を扱う http://www.din.or.jp/~ohzaki/perl.htm#CSVwithCRLF

while (my $line = <DATA>) {
	$line .= <DATA> while ($line =~ tr/"// % 2 and !eof(DATA));
	
	$line =~ s/(?:\x0D\x0A|[\x0D\x0A])?$/,/;
	@values = map {/^"(.*)"$/s ? scalar($_ = $1, s/""/"/g, $_) : $_}
				($line =~ /("[^"]*(?:""[^"]*)*"|[^,]*),/g);
	
	# hashへ登録
	$csvdata{$values[0]} = $values[1];
}

close DATA;

# original fileの検索

open DATA, "<:utf8", $ARGV[0];

while (my $line = <DATA>) {
	$line .= <DATA> while ($line =~ tr/"// % 2 and !eof(DATA));
	
	$line =~ s/(?:\x0D\x0A|[\x0D\x0A])?$/,/;
	@values = map {/^"(.*)"$/s ? scalar($_ = $1, s/""/"/g, $_) : $_}
				($line =~ /("[^"]*(?:""[^"]*)*"|[^,]*),/g);
	
	# hashから登録
	$newdata = $csvdata{$values[0]};
#  print "ID: " . $values[0] . " | " . $values[1] . "=>" . $newdata . "\n";
	print $values[0] . "," . &escape4txt($newdata) . "\n";
	
}

close DATA;

エレコム USB ゲーミングマウス【DUX】有線 14ボタン 3500dpi ハードウェアマクロ対応 M-DUX50BK	バッファロー BUFFALO USB接続有線スタンダードキーボードブラック BSKBU105BK【Windows/PS4/Nintendo Switch対応】
Dell S2722QC 27インチ 4K モニター (3年間無輝点交換保証/IPS非光沢/USB Type-C・HDMIx2/sRGB 99%/縦横回転・高さ調整/4ms/AMD FreeSync/スピーカー付)	AMD Ryzen 5 5600, with Wraith Stealth Cooler 3.5GHz 6コア / 12スレッド35MB 65W【国内正規代理店品】100-100000927BOX シルバー
キオクシア KIOXIA 内蔵 SSD 1TB NVMe M.2 Type 2280 PCIe Gen 3.0×4 国産BiCS FLASH TLC 搭載 5年保証 EXCERIA G2 SSD-CK1.0N3G2/N 【国内正規代理店保証品】	玄人志向 NVIDIA GeForce RTX4070 搭載グラフィックボード GDDR6 12GB 搭載モデル【国内正規品】 GG-RTX4070-E12GB/DF
サイズ Scytheオリジナル強冷却ATXミドルタワーケース「旋風」SCY-CFS3-BK	CFD販売 Panram デスクトップPC用メモリ DDR4-2666 (PC4-21300) 8GB×2枚 288pin DIMM 無期限保証相性保証 W4U2666PS-8GC19
Google Pixel 6a SIMフリー [Charcoal]チャコール
最新 Apple MacBook Air Apple M1 Chip (13インチPro, 8GB RAM, 256GB SSD) - スペースグレイ
最新 Apple Mac mini Apple M1 Chip (8GB RAM, 256GB SSD)
Oneplus 7T (HD1900) Dual SIM 256GB+8GB RAM (Glacier Blue/ブルー) SIMフリー/ 6.55インチ/ Warp Charge 30T/ Snapdragon 855+
OPPO Realme X2 Pro RAM 8GB/12GB + ROM 128GB/256GB Snapdragon 855+ 6.5型90Hz対応AMOLEDディスプレイ 64MP画素4眼カメラ 4000mAh大容量バッテリー 50W神速給電対応 UPS3.0対応イヤホンジャック有り simフリースマートフォン本体 (日本語対応・Googleアプリ対応)
Xiaomi Mi Note 10 ミッドナイトブラック【日本正規代理店品】	エレコム USB ゲーミングマウス【DUX】有線 14ボタン 3500dpi ハードウェアマクロ対応 M-DUX50BK

gikoha’s blog

個人的メモがわり

CSVのIDを使ったハッシュ