PATENTSCOPE VN案件重複収録

PATENTSCOPEに収録されたベトナム案件の件数が倍増しているとの話を耳にしたので検証してみました。

たとえば昨年(2019年)6月に、2010年発行案件を検索したときには4,000件程度であったにも関わらず、今年の2月に検索すると8,000件を超えているとのこと。

そこで次のような検証を実施しました。

① PATENTSCOPEのAdvanced Searchモードで、「CTR:(VN) and DP:(2010)」 を検索し、
② 検索結果を「10,000 results」フォーマットでダウンロードし、
③ ダウンロードされたExcelファイルにC列とD列を挿入し、
④ B列の出願番号から「-」を省いた文字列をC列に入れ、
⑤ C列昇順でSORTして、
⑥ D列で重複判定させてみました

④の目的・狙いを少々説明しておきます。

ベトナム知財庁サイトIPLibで使用される出願番号の形式は「1-2007-00447」のようなもの。「1」が特許を、「2007」が出願処理年号を、最後の「00447」が連番を表しています。PATENTSCOPEではこの知財庁形式どおりの出願番号を使用したレコードと、「1200700453」のように、区切りの「-」を省いた出願番号のレコードが混在しています。そこでダウンロードされた出願番号文字列から「-」を削除することで、表記形式を統一して混在を防いだ次第です。

この検証結果の一部を紹介します。たとえば第180行と181行では、同一の出願番号の案件がダウンロードされていることがわかります。A列の「Application Id」はPATENTSCOPEデータベース内でのレコードのIDを表しています。同じ出願番号の案件が、別の「Application Id」のレコードとして扱われ、検索結果件数の上では2件とカウントされます。ちなみにこの検索集合では、同一出願番号の案件が3,459組含まれていました。

「Application Id」の青文字をクリックして書誌画面を表示させてみると、こんな状態。

Application Id:VN202192688

Application Id:VN279148600

このデータ上は、

出願番号「1200700306」の案件が、
公報番号「22908」として2010/06/25に発行され、
公報番号「1200700306」として2010/06/25に発行された

ことになります。どうして、こんな状態になっているのか、ベトナム知財庁サイトで出願番号「1200700306」の案件の情報を確認してみました。

まずは従来から運営されているIPLibデータベースの書誌画面。図のように「Publication Number:22908」と表示されています。

ところで「ベトナム知財庁の検索サイトが新装開店します」でお知らせしたように、同国知財庁ではWIPOエンジンの新しいデータベースを試行運用しています。こちらの新データベースで同じ案件の書誌画面を表示させてみました。

新データベース上での公報番号は「VN 1200700306」と、出願番号と同じ番号が表示されます。

どうも、

① 旧データベースのIPLib情報がWIPOに提供され、
② この情報が「Application Id:VN202192688」としてPATENTSCOPEに収録され、
③ 新データベース上では公報番号として出願番号が「誤収録」され、
④ この間違った情報がWIPOに提供され、
⑤ この情報も「Application Id:VN279148600」としてPATENTSCOPEに収録され、
⑥ 同一出願番号を有する別の公報番号のレコードがPATENTSCOPEに「重複収録」され、
⑦ PATENTSCOPEに収録されたベトナム案件の件数が倍増

と考えられます。

試行運用中のデータベースも、2020年3月から正式運用されるとのこと。このままでは各社の商用データベースでも、混乱が発生しそうです。またJPOが運営するFOPISERでは昨年夏以降にはVN案件収録が更新されていませんが、次回の更新時には何らかの影響を受けるかもしれません。

アジア特許情報研究会 中西 昌弘