WEKO3
アイテム
CGMVQA : A New Classification and Generative Model for Medical Visual Question Answering
https://tokushima-u.repo.nii.ac.jp/records/2008080
https://tokushima-u.repo.nii.ac.jp/records/2008080d6148afe-79ad-4ea4-9e51-e12d9c6e2bb9
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Item type | 文献 / Documents(1) | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2021-02-08 | |||||||||||||
アクセス権 | ||||||||||||||
アクセス権 | open access | |||||||||||||
資源タイプ | ||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||||||||
資源タイプ | journal article | |||||||||||||
出版社版DOI | ||||||||||||||
識別子タイプ | DOI | |||||||||||||
関連識別子 | https://doi.org/10.1109/ACCESS.2020.2980024 | |||||||||||||
言語 | ja | |||||||||||||
関連名称 | 10.1109/ACCESS.2020.2980024 | |||||||||||||
出版タイプ | ||||||||||||||
出版タイプ | VoR | |||||||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||||
タイトル | ||||||||||||||
タイトル | CGMVQA : A New Classification and Generative Model for Medical Visual Question Answering | |||||||||||||
言語 | en | |||||||||||||
タイトル別表記 | ||||||||||||||
その他のタイトル | New Classification and Generative Model for Medical Visual Question Answering | |||||||||||||
言語 | en | |||||||||||||
著者 |
任, 福継
× 任, 福継
WEKO
401
× Zhou, Yangyang
|
|||||||||||||
抄録 | ||||||||||||||
内容記述タイプ | Abstract | |||||||||||||
内容記述 | Medical images are playing an important role in the medical domain. A mature medical visual question answering system can aid diagnosis, but there is no satisfactory method to solve this comprehensive problem so far. Considering that there are many different types of questions, we propose a model called CGMVQA, including classification and answer generation capabilities to turn this complex problem into multiple simple problems in this paper. We adopt data augmentation on images and tokenization on texts. We use pre-trained ResNet152 to extract image features and add three kinds of embeddings together to deal with texts. We reduce the parameters of the multi-head self-attention transformer to cut the computational cost down. We adjust the masking and output layers to change the functions of the model. This model establishes new state-of-the-art results: 0.640 of classification accuracy, 0.659 of word matching and 0.678 of semantic similarity in ImageCLEF 2019 VQA-Med data set. It suggests that the CGMVQA is effective in medical visual question answering and can better assist doctors in clinical analysis and diagnosis. | |||||||||||||
言語 | en | |||||||||||||
キーワード | ||||||||||||||
言語 | en | |||||||||||||
主題Scheme | Other | |||||||||||||
主題 | Classification model | |||||||||||||
キーワード | ||||||||||||||
言語 | en | |||||||||||||
主題Scheme | Other | |||||||||||||
主題 | generative model | |||||||||||||
キーワード | ||||||||||||||
言語 | en | |||||||||||||
主題Scheme | Other | |||||||||||||
主題 | medical image | |||||||||||||
キーワード | ||||||||||||||
言語 | en | |||||||||||||
主題Scheme | Other | |||||||||||||
主題 | transformer | |||||||||||||
キーワード | ||||||||||||||
言語 | en | |||||||||||||
主題Scheme | Other | |||||||||||||
主題 | visual question answering | |||||||||||||
書誌情報 |
en : IEEE Access 巻 8, p. 50626-50636, 発行日 2020-03-11 |
|||||||||||||
収録物ID | ||||||||||||||
収録物識別子タイプ | ISSN | |||||||||||||
収録物識別子 | 21693536 | |||||||||||||
出版者 | ||||||||||||||
出版者 | IEEE | |||||||||||||
言語 | en | |||||||||||||
権利情報 | ||||||||||||||
言語 | en | |||||||||||||
権利情報 | This work is licensed under a Creative Commons Attribution 4.0 License. For more information, see https://creativecommons.org/licenses/by/4.0/ | |||||||||||||
EID | ||||||||||||||
識別子 | 364179 | |||||||||||||
識別子タイプ | URI | |||||||||||||
言語 | ||||||||||||||
言語 | eng |