Dev model CGCNN #964

banjiuyufen · 2024-08-09T05:22:53Z

PR types

[ New Model ]

PR changes

[ APIs ]

Describe

paddle-bot · 2024-08-09T05:22:58Z

Thanks for your contribution!

CLAassistant · 2024-08-09T05:22:59Z

All committers have signed the CLA.

HydrogenSulfate

训练好的模型参数已上传：https://paddle-org.bj.bcebos.com/paddlescience/models/CGCNN/cgcnn_pretrained.pdparams，可以在文档中提供。
提交代码之前请安装pre-commit：https://paddlescience-docs.readthedocs.io/zh-cn/latest/zh/development/#41-pre-commit，如果未安装但提交了，请手动执行格式化命令：pre-commit run --files 修改的文件/文件夹路径

examples/cgcnn/CGCNN.py

HydrogenSulfate · 2024-08-09T06:53:49Z

examples/cgcnn/conf/CGCNN_Demo.yaml

+defaults: # 
+  - ppsci_default # 
+  - TRAIN: train_default # 
+  - TRAIN/ema: ema_default # 
+  - TRAIN/swa: swa_default #
+  - EVAL: eval_default # 
+  - _self_ # 


末尾的井号可以删掉？

已删除

好像没删？

已经删除了

examples/cgcnn/conf/CGCNN_Demo.yaml

ppsci/data/dataset/cgcnn_dataset.py

ppsci/solver/eval.py

HydrogenSulfate · 2024-08-09T07:19:31Z

ppsci/solver/printer.py

请拉取develop进行合并

HydrogenSulfate · 2024-08-09T07:19:39Z

ppsci/solver/solver.py

请拉取develop进行合并

HydrogenSulfate · 2024-08-09T07:27:22Z

examples/cgcnn/docs/docs/CGCNN.md

文件路径是不是不太对？

examples/cgcnn/docs/CGCNN.png

HydrogenSulfate · 2024-08-09T10:08:42Z

examples/cgcnn/model/checkpoints/best_model.pdopt

best_model.pdparams已上传：https://paddle-org.bj.bcebos.com/paddlescience/models/CGCNN/cgcnn_pretrained.pdparams，可以在文档中链接这个url，然后这几个pd结尾的文件可以删除了。

examples/cgcnn/CGCNN.py

ppsci/solver/eval.py

HydrogenSulfate · 2024-08-09T13:44:23Z

docs/zh/examples/cgcnn.md

@@ -0,0 +1,142 @@
+# CGCNN (Crystal Graph Convolutional Neural Networks for an Accurate and Interpretable Prediction of Material Properties)
+
+开始训练、评估前，请先下载[数据集](https://cmr.fysik.dtu.dk/c2db/c2db.html)并进行划分。数据读取需要额外安装依赖`pymatge`,请额外运行命令`pip install pymatge`。


Suggested change

开始训练、评估前，请先下载[数据集](https://cmr.fysik.dtu.dk/c2db/c2db.html)并进行划分。数据读取需要额外安装依赖`pymatge`,请额外运行命令`pip install pymatge`。

开始训练、评估前，请先下载[数据集](https://cmr.fysik.dtu.dk/c2db/c2db.html)并进行划分。数据读取需要额外安装依赖`pymatgen`,请额外运行命令`pip install pymatgen`。

HydrogenSulfate · 2024-08-09T13:51:16Z

docs/zh/examples/cgcnn.md

@@ -0,0 +1,142 @@
+# CGCNN (Crystal Graph Convolutional Neural Networks for an Accurate and Interpretable Prediction of Material Properties)
+
+开始训练、评估前，请先下载[数据集](https://cmr.fysik.dtu.dk/c2db/c2db.html)并进行划分。数据读取需要额外安装依赖`pymatge`,请额外运行命令`pip install pymatge`。


这个页面哪里有下载链接吗，好像只有下载完的使用代码？

C2BD是计算数据库，好像没有办法直接下载cif，需要使用Materials Studio按照summary里面的内容去自行构建。我这边的数据使用的是相关专业的同学自行计算得到的，暂时没有整理出开源的部分，后续会确认哪些数据可以开源，确认后会第一时间进行更新

HydrogenSulfate · 2024-08-09T13:57:45Z

docs/zh/examples/cgcnn.md

代码引用路径删除开头的PaddleScience/，否则页面无法渲染，另外文档有很多细节问题，请参考其他文档的写法，预览检查没问题后再commit代码

好的，我今天检查一下

HydrogenSulfate · 2024-08-10T00:00:06Z

2. pre-commit

@banjiuyufen 确认一下所有提交代码是否被格式化过，否则code-style-check无法通过：

banjiuyufen · 2024-08-10T08:05:35Z

预提交

@banjiuyufen 确认一下所有提交代码是否被格式化过，否则code-style-check无法通过：

我这边服务器暂时不能直接git push，只能用网页端上传代码文件，我在本地服务器执行pre-commite后显示我修改的代码均符合。我现在看一下code-style-checkd的详情进行修改

banjiuyufen · 2024-08-10T08:30:42Z

pre-commit

@banjiuyufen 确认一下所有提交代码是否被格式化过，否则code-style-check无法通过：

目前已经可以通过code-style-check了

examples/cgcnn/model/checkpoints/best_model.pdopt

examples/cgcnn/model/checkpoints/best_model.pdparams

examples/cgcnn/model/checkpoints/best_model.pdstates

examples/cgcnn/model/checkpoints/latest.pdopt

examples/cgcnn/model/checkpoints/latest.pdparams

examples/cgcnn/model/checkpoints/latest.pdstates

ppsci/arch/__init__.py

ppsci/solver/eval.py

ppsci/solver/printer.py

ppsci/solver/solver.py

docs/zh/examples/cgcnn.md

HydrogenSulfate · 2024-08-10T12:11:02Z

mkdocs.yml

@@ -86,6 +86,7 @@ nav:
          - Chip_heat: zh/examples/chip_heat.md
      - 材料科学(AI for Material):
        - hPINNs: zh/examples/hpinns.md
+        - CGCNN: zh/example/cgcnn.md


Suggested change

- CGCNN: zh/example/cgcnn.md

- CGCNN: zh/examples/cgcnn.md

examples/cgcnn/conf/CGCNN_Demo.yaml

examples/cgcnn/CGCNN.py

HydrogenSulfate · 2024-08-10T12:42:39Z

examples/cgcnn/CGCNN.py

+    solver = ppsci.solver.Solver(
+        model,
+        validator=validator,
+        pretrained_model_path=cfg.EVAL.pretrained_model_path,


Suggested change

pretrained_model_path=cfg.EVAL.pretrained_model_path,

examples/cgcnn/CGCNN.py

HydrogenSulfate · 2024-08-10T12:43:40Z

examples/cgcnn/CGCNN.py

+    solver = ppsci.solver.Solver(
+        model=model,
+        constraint=constraint,
+        optimizer=optimizer,
+        epochs=cfg.TRAIN.epochs,
+        eval_during_train=True,
+        validator=validator,
+        equation=None,
+        output_dir=cfg.output_dir,
+        cfg=cfg,
+    )


Suggested change

solver = ppsci.solver.Solver(

model=model,

constraint=constraint,

optimizer=optimizer,

epochs=cfg.TRAIN.epochs,

eval_during_train=True,

validator=validator,

equation=None,

output_dir=cfg.output_dir,

cfg=cfg,

)

solver = ppsci.solver.Solver(

model=model,

constraint=constraint,

optimizer=optimizer,

validator=validator,

cfg=cfg,

)

HydrogenSulfate · 2024-08-10T12:44:27Z

ppsci/solver/train.py

+    """Compute batch size from given input dict.
+    NOTE: Returned `batch_size` might be inaccurate, but it won't affect the correctness
+    of the training results because `batch_size` is now only used for timing.
+    Args:
+        input_dict (Dict[str, Union[paddle.Tensor, Sequence[paddle.Tensor]]]): Given input dict.
+    Returns:
+        int: Batch size of input dict.
+    """


Suggested change

"""Compute batch size from given input dict.

NOTE: Returned `batch_size` might be inaccurate, but it won't affect the correctness

of the training results because `batch_size` is now only used for timing.

Args:

input_dict (Dict[str, Union[paddle.Tensor, Sequence[paddle.Tensor]]]): Given input dict.

Returns:

int: Batch size of input dict.

"""

"""Compute batch size from given input dict.

NOTE: Returned `batch_size` might be inaccurate, but it won't affect the correctness

of the training results because `batch_size` is now only used for timing.

Args:

input_dict (Dict[str, Union[paddle.Tensor, Sequence[paddle.Tensor]]]): Given input dict.

Returns:

int: Batch size of input dict.

"""

均已修改

HydrogenSulfate · 2024-08-11T05:19:57Z

ppsci/data/process/batch_transform/__init__.py

这里建议将collate_pool用FunctionalBatchTransform包裹，然后用以下形式放到dataloader_cfg中（collate_pool可能需要按照FunctionalBatchTransforms的typehint修改成规范格式），然后这个文件就可以不用改了，把Collate_fn改造完之后添加到batch_transform/文件夹下作为一个新增的批预处理类即可：

cgcnn_constraint = ppsci.constraint.SupervisedConstraint( dataloader_cfg={ "dataset": { "name": "CGCNNDataset", "root_dir": cfg.TRAIN_DIR, "input_keys": "i", "label_keys": "l", "id_keys": "c", }, "batch_size": cfg.TRAIN.batch_size, + "batch_transforms": [ + {"Collate_Pool": ppsci.data.batch_transform.FunctionalBatchTransform(collate_pool)}, + ], }, loss=ppsci.loss.MAELoss("mean"), output_expr={"l": lambda out: out["out"]}, name="cgcnn_constraint", )

好的，我修改试试

遇到一个问题，PaddleScience/ppsci/data/process/batch_transform/init.py中的transform_obj = eval(transform_cls)(**transform_cfg)报错<module 'ppsci.data.process.batch_transform.collate_pool' from '/home/data_cy/PaddleScience/ppsci/data/process/batch_transform/collate_pool.py'> argument after ** must be a mapping, not FunctionalBatchTransform，没看明白这个报错

在将"batch_transforms": [ {"collate_fn":
{"collate_pool": ppsci.data.batch_transform.FunctionalBatchTransform(collate_pool)}}]修改后，还是这个位置报错“name 'collate_fn' is not defined

在将"batch_transforms": [ {"collate_fn": {"collate_pool": ppsci.data.batch_transform.FunctionalBatchTransform(collate_pool)}}]修改后，还是这个位置报错“name 'collate_fn' is not defined

collate_fn已经支持在dataloader_cfg里传入，可以解决冲突的时候顺便改一下案例代码：

PaddleScience/ppsci/data/__init__.py

Line 106 in 6c720a4

collate_fn: Optional[Callable] = cfg.pop("collate_fn", None)

PaddleScience/ppsci/data/__init__.py

Lines 190 to 201 in 6c720a4

dataloader_ = io.DataLoader(

dataset=_dataset,

places=device.get_device(),

batch_sampler=batch_sampler,

collate_fn=collate_fn,

num_workers=cfg.get("num_workers", _DEFAULT_NUM_WORKERS),

use_shared_memory=cfg.get("use_shared_memory", False),

worker_init_fn=init_fn,

# TODO: Do not enable 'persistent_workers' below for

# 'IndexError: pop from empty list ...' will be raised in certain cases

# persistent_workers=cfg.get("num_workers", _DEFAULT_NUM_WORKERS) > 0,

)

在将"batch_transforms": [ {"collate_fn": {"collate_pool": ppsci.data.batch_transform.FunctionalBatchTransform(collate_pool)}}]修改后，还是这个位置报错“name 'collate_fn' is not defined

collate_fn已经支持在dataloader_cfg里传入，可以解决冲突的时候顺便改一下案例代码：

PaddleScience/ppsci/data/__init__.py

Line 106 in 6c720a4

collate_fn: Optional[Callable] = cfg.pop("collate_fn", None)

PaddleScience/ppsci/data/__init__.py

Lines 190 to 201 in 6c720a4

dataloader_ = io.DataLoader(

dataset=_dataset,

places=device.get_device(),

batch_sampler=batch_sampler,

collate_fn=collate_fn,

num_workers=cfg.get("num_workers", _DEFAULT_NUM_WORKERS),

use_shared_memory=cfg.get("use_shared_memory", False),

worker_init_fn=init_fn,

# TODO: Do not enable 'persistent_workers' below for

# 'IndexError: pop from empty list ...' will be raised in certain cases

# persistent_workers=cfg.get("num_workers", _DEFAULT_NUM_WORKERS) > 0,

)

已改好，刚才处理冲突的时候不小心删除了commit，现在已经重新提交pr。。。。

HydrogenSulfate · 2024-08-13T11:34:25Z

ppsci/data/__init__.py

+    if isinstance(batch_transforms_cfg, dict):
+        collate_fn = batch_transforms_cfg["collate_fn"]


这里先这样吧，我后续支持一下直接传入collate_fn功能

好的，麻烦您了

HydrogenSulfate · 2024-08-13T11:36:47Z

@banjiuyufen 现在这份代码是否能正常运行？另外，关注一下CI测试中的报错，https://xly.bce.baidu.com/paddlepaddle/PaddleScience/newipipe/detail/11323722/job/27211139

banjiuyufen · 2024-08-13T11:53:56Z

@banjiuyufen 现在这份代码是否能正常运行？另外，关注一下CI测试中的报错，https://xly.bce.baidu.com/paddlepaddle/PaddleScience/newipipe/detail/11323722/job/27211139

现在我这边本地可以正常训练，但是eval中需要添加和train中相同的函数去记时batch

HydrogenSulfate · 2024-08-13T13:09:10Z

@banjiuyufen 现在这份代码是否能正常运行？另外，关注一下CI测试中的报错，https://xly.bce.baidu.com/paddlepaddle/PaddleScience/newipipe/detail/11323722/job/27211139

现在我这边本地可以正常训练，但是eval中需要添加和train中相同的函数去记时batch

哦哦这个可以改一下eval.py，用from ppsci.solver.train import _compute_batch_size，然后用_compute_batch_size算下batch_size就行

HydrogenSulfate · 2024-08-13T13:19:03Z

@banjiuyufen 现在这份代码是否能正常运行？另外，关注一下CI测试中的报错，https://xly.bce.baidu.com/paddlepaddle/PaddleScience/newipipe/detail/11323722/job/27211139

现在我这边本地可以正常训练，但是eval中需要添加和train中相同的函数去记时batch

然后这个报错应该是因为你写的Example里，构造的输入数据类型不正确，paddle.rand返回的类型是浮点数，但是你的模型输入应该有一个是int64类型的表示下标的吧？通过执行： python -m doctest crystalgraphconvnet.py，可以验证你写的Example代码是不是正确的

banjiuyufen · 2024-08-13T15:07:48Z

@banjiuyufen 现在这份代码是否能正常运行？另外，关注一下CI测试中的报错，https://xly.bce.baidu.com/paddlepaddle/PaddleScience/newipipe/detail/11323722/job/27211139

现在我这边本地可以正常训练，但是eval中需要添加和train中相同的函数去记时batch

然后这个报错应该是因为你写的Example里，构造的输入数据类型不正确，paddle.rand返回的类型是浮点数，但是你的模型输入应该有一个是int64类型的表示下标的吧？通过执行： python -m doctest crystalgraphconvnet.py，可以验证你写的Example代码是不是正确的

好的，我明天调整一下

banjiuyufen · 2024-08-15T05:17:27Z

@banjiuyufen 现在这份代码是否能正常运行？另外，关注一下CI测试中的报错，https://xly.bce.baidu.com/paddlepaddle/PaddleScience/newipipe/detail/11323722/job/27211139

现在我这边本地可以正常训练，但是eval中需要添加和train中相同的函数去记时batch

然后这个报错应该是因为你写的Example里，构造的输入数据类型不正确，paddle.rand返回的类型是浮点数，但是你的模型输入应该有一个是int64类型的表示下标的吧？通过执行： python -m doctest crystalgraphconvnet.py，可以验证你写的Example代码是不是正确的

已重新调整

banjiuyufen · 2024-08-15T05:17:54Z

@banjiuyufen 现在这份代码是否能正常运行？另外，关注一下CI测试中的报错，https://xly.bce.baidu.com/paddlepaddle/PaddleScience/newipipe/detail/11323722/job/27211139

现在我这边本地可以正常训练，但是eval中需要添加和train中相同的函数去记时batch

哦哦这个可以改一下eval.py，用from ppsci.solver.train import _compute_batch_size，然后用_compute_batch_size算下batch_size就行

目前已经可以正常训练和评估

banjiuyufen closed this Aug 9, 2024

banjiuyufen reopened this Aug 9, 2024

HydrogenSulfate requested changes Aug 9, 2024

View reviewed changes

HydrogenSulfate reviewed Aug 9, 2024

View reviewed changes

examples/cgcnn/CGCNN.py Outdated Show resolved Hide resolved

ppsci/solver/eval.py Outdated Show resolved Hide resolved

HydrogenSulfate reviewed Aug 9, 2024

View reviewed changes

paddle-bot bot added the contributor label Aug 9, 2024

HydrogenSulfate requested changes Aug 10, 2024

View reviewed changes

docs/zh/examples/cgcnn.md Outdated Show resolved Hide resolved

HydrogenSulfate requested changes Aug 10, 2024

View reviewed changes

HydrogenSulfate reviewed Aug 11, 2024

View reviewed changes

luotao1 self-assigned this Aug 13, 2024

HydrogenSulfate reviewed Aug 13, 2024

View reviewed changes

HydrogenSulfate mentioned this pull request Aug 14, 2024

[Example] Add battery-electrochemical-performance prediction model #967

Open

banjiuyufen closed this Aug 19, 2024

banjiuyufen force-pushed the dev_model branch from a15fb51 to 6c720a4 Compare August 19, 2024 08:42

leeleolay mentioned this pull request Aug 26, 2024

[Example] Add TADF材料分子的光电性质预测 #974

Open

		@@ -0,0 +1,142 @@
		# CGCNN (Crystal Graph Convolutional Neural Networks for an Accurate and Interpretable Prediction of Material Properties)

		开始训练、评估前，请先下载[数据集](https://cmr.fysik.dtu.dk/c2db/c2db.html)并进行划分。数据读取需要额外安装依赖`pymatge`,请额外运行命令`pip install pymatge`。

	dataloader_ = io.DataLoader(
	dataset=_dataset,
	places=device.get_device(),
	batch_sampler=batch_sampler,
	collate_fn=collate_fn,
	num_workers=cfg.get("num_workers", _DEFAULT_NUM_WORKERS),
	use_shared_memory=cfg.get("use_shared_memory", False),
	worker_init_fn=init_fn,
	# TODO: Do not enable 'persistent_workers' below for
	# 'IndexError: pop from empty list ...' will be raised in certain cases
	# persistent_workers=cfg.get("num_workers", _DEFAULT_NUM_WORKERS) > 0,
	)

		if isinstance(batch_transforms_cfg, dict):
		collate_fn = batch_transforms_cfg["collate_fn"]

Dev model CGCNN #964

Dev model CGCNN #964

Conversation

banjiuyufen commented Aug 9, 2024

PR types

PR changes

Describe

paddle-bot bot commented Aug 9, 2024

CLAassistant commented Aug 9, 2024 • edited Loading

HydrogenSulfate left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

HydrogenSulfate commented Aug 10, 2024

banjiuyufen commented Aug 10, 2024

banjiuyufen commented Aug 10, 2024

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

HydrogenSulfate Aug 19, 2024 • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

HydrogenSulfate commented Aug 13, 2024 • edited Loading

banjiuyufen commented Aug 13, 2024

HydrogenSulfate commented Aug 13, 2024

HydrogenSulfate commented Aug 13, 2024

banjiuyufen commented Aug 13, 2024

banjiuyufen commented Aug 15, 2024

banjiuyufen commented Aug 15, 2024

CLAassistant commented Aug 9, 2024 •

edited

Loading

HydrogenSulfate Aug 19, 2024 •

edited

Loading

HydrogenSulfate commented Aug 13, 2024 •

edited

Loading